JP2020035010A - Thinking support system, thinking support program, storage medium for thinking support program and storage medium for thinking support information - Google Patents

Thinking support system, thinking support program, storage medium for thinking support program and storage medium for thinking support information Download PDF

Info

Publication number
JP2020035010A
JP2020035010A JP2018158543A JP2018158543A JP2020035010A JP 2020035010 A JP2020035010 A JP 2020035010A JP 2018158543 A JP2018158543 A JP 2018158543A JP 2018158543 A JP2018158543 A JP 2018158543A JP 2020035010 A JP2020035010 A JP 2020035010A
Authority
JP
Japan
Prior art keywords
case
phrase
information
phrases
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018158543A
Other languages
Japanese (ja)
Other versions
JP6501439B1 (en
Inventor
本田 宣昭
Nobuaki Honda
宣昭 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Think Plus Inc
Think-Plus Inc
Original Assignee
Think Plus Inc
Think-Plus Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Think Plus Inc, Think-Plus Inc filed Critical Think Plus Inc
Priority to JP2018158543A priority Critical patent/JP6501439B1/en
Application granted granted Critical
Publication of JP6501439B1 publication Critical patent/JP6501439B1/en
Publication of JP2020035010A publication Critical patent/JP2020035010A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a thinking support technique which is related to a thinking object text, goes beyond the framework providing hints in traditional analogies, provides a flexible and wide hints, is heavily independent of user skills and knowledge, and needs a low effort for its use.SOLUTION: A text highly relevant with a thinking object text is presented by converting a set of wo-case neighborhood words and phrases to a set of relevant wo-case neighborhood words and phrases using the information relevant with connections between words and phrases, and by converting the wo-case to the highly relevant wo-case also using the information of the set of the converted relevant wo-case neighborhood words and phrases, where the set of the wo-case neighborhood words and phrases is the set of the words and phrases located in the neighborhood of the wo-case included in the thinking object text and the set of the relevant wo-case neighborhood words and phrases is the set of the wo-case neighborhood words and phrases of the set of the highly relevant words and phrases.SELECTED DRAWING: Figure 1

Description

本発明は、自然言語処理技術に関し、特に取得された思考の対象となるテキストに対し関連を有するテキストの候補を提示する思考支援技術に関する。 The present invention relates to a natural language processing technology, and more particularly, to a thinking support technology for presenting text candidates related to an acquired text to be thought.

さまざまな課題を解決するためのヒントを得る有用な手法の一つとしてアナロジーがある(特許文献1、特許文献2、非特許文献1、および非特許文献2など参照)。非特許文献2には、「折刃式カッターナイフ」を発想するためのヒントを、アナロジーを用いて得る事例についての説明がある。具体的には、「切断すると鋭利」という視点より「ガラス」と「カッターナイフ」の類似性を得、また、「溝部を設けることにより切断可能」という視点より「板チョコレート」と「カッターナイフ」の類似性を得、これら2つの類似性をヒントとして提示することにより、「折刃式カッターナイフ」という発想を可能とする創造性の高い設計支援を実現しようとしている。 An analogy is one of useful methods for obtaining hints for solving various problems (see Patent Literature 1, Patent Literature 2, Non-Patent Literature 1, Non-Patent Literature 2, and the like). Non-Patent Literature 2 describes a case where a hint for conceiving a “folding blade type cutter knife” is obtained using analogy. Specifically, the similarity of "glass" and "cutter knife" is obtained from the viewpoint of "sharp when cut", and "plate chocolate" and "cutter knife" from the viewpoint of "can be cut by providing grooves". By obtaining the similarity of the above and presenting these two similarities as hints, it is intended to realize a highly creative design support that enables the idea of a "folding blade type cutter knife".

特許第3373868号公報Japanese Patent No. 3373868 特開2017−59077号公報JP 2017-59077 A

細谷功, アナロジー思考,東洋経済新報社, 2011, ISBN978-4-492-55697-9Isao Hosoya, Thinking Analogy, Toyo Keizai Shimpo, 2011, ISBN978-4-492-55697-9 武田英明他, Universal Abduction Studioの開発(第4報)−UASのための多重解釈型知識表現−, 精密工学会学術講演会講演論文集2004年度精密工学会春季大会, 197-197, 2004Hideaki Takeda et al., Development of Universal Abduction Studio (4th report) -Multiple Interpretation Type Knowledge Representation for UAS-, Proc. Of JSCE Academic Lecture Meeting 2004, JSCE Spring Conference, 197-197, 2004 J. Pennington, R. Socher, C. D. Manning, GloVe: Global Vectors for Word Representation, Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 1532-1543, 2014J. Pennington, R. Socher, C. D. Manning, GloVe: Global Vectors for Word Representation, Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 1532-1543, 2014 T. Mikolov, I. Sutskever, K. Chen, G. Corrado, J. Dean, Distributed Representations of Words and Phrases and their Compositionality, Proceedings of Advances in Neural Information Processing Systems 26, 3111-3119, 2013T. Mikolov, I. Sutskever, K. Chen, G. Corrado, J. Dean, Distributed Representations of Words and Phrases and their Compositionality, Proceedings of Advances in Neural Information Processing Systems 26, 3111-3119, 2013 Masayuki Asahara, NWJC2Vec: Word embedding dataset from ‘NINJAL Web Japanese Corpus’, Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, 24:1, 7-22, 2018Masayuki Asahara, NWJC2Vec: Word embedding dataset from ‘NINJAL Web Japanese Corpus’, Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, 24: 1, 7-22, 2018 nwjc2vec(国立国語研究所):http://nwjc-data.ninjal.ac.jp/nwjc2vec/nwjc2vec (National Institute for Japanese Language): http://nwjc-data.ninjal.ac.jp/nwjc2vec/ 神崎享子他, コーパスからの単語間の意味関係の獲得とその応用, 情報通信研究機構季報, 53巻3号, 29-37, 2007Yoko Kanzaki et al., Acquisition of Semantic Relationship between Words from Corpus and Its Application, National Institute of Information and Communications Technology Quarterly Report, Vol. 53, No. 3, 29-37, 2007 Pang-Ning Tan, Vipin Kumar, Jaideep Srivastava, Selecting the Right Interestingness Measure for Association Pattern, Proc. ACM-SIGKDD Conf. Knowledge Discovery and Data Mining, 491-502, 2002Pang-Ning Tan, Vipin Kumar, Jaideep Srivastava, Selecting the Right Interestingness Measure for Association Pattern, Proc.ACM-SIGKDD Conf. Knowledge Discovery and Data Mining, 491-502, 2002 日本語記述文法研究会, 現代日本語文法2, くろしお出版, 2009, ISBN978-4-87424-460-9Japanese Writing Grammar Study Group, Contemporary Japanese Grammar 2, Kuroshio Publishing, 2009, ISBN978-4-87424-460-9 村岡雅康他, 係り受け関係を用いた句ベクトルの生成, 言語処理学会第20回年次大会発表論文集, 1055-1058, 2014Masayasu Muraoka et al., Generation of Phrase Vectors Using Dependency Relationships, Proc. Of the 20th Annual Conference of the Linguistic Processing Society, 1055-1058, 2014

アナロジーは、課題に対するヒントを見出すことができれば非常に効果的な手法である。しかしながら、非特許文献2のような支援システムなどを用いずに人手のみでヒントを見出そうとすれば、使用者の知識・スキル等に大きく依存するという課題があった。また、そのような支援システムを用いる場合には、その構築と使用に多大な労力を要するという課題があった。 An analogy is a very effective technique if you can find hints for a task. However, there is a problem that if an attempt is made to find hints only by hand without using a support system or the like as in Non-Patent Document 2, there is a problem that it greatly depends on the knowledge and skills of the user. In addition, when such a support system is used, there is a problem that a great deal of labor is required for its construction and use.

また、後に示すように、従来のアナロジーという手法では、「対象」に関する構造的な類似性に着目しているため、それ以外の関連性に基づく柔軟で幅広いヒントを得ることは一般に難しいという課題があった。   Also, as we will see later, the traditional analogy approach focuses on structural similarities related to "objects," so it is generally difficult to obtain flexible and broad hints based on other relevance. there were.

同様の理由により、思考の対象が、具体的な「もの」ではなく、抽象的な「こと」である場合にも、従来のアナロジーでは、「対象」に関する構造的な類似性を見出すことは一般に難しいため、有用なヒントを得ることは一般に難しいという課題もあった。   For the same reason, even if the object of thinking is not a concrete "thing" but an abstract "thing", in a conventional analogy, finding structural similarity about the "object" is generally There was also a problem that it was difficult to obtain useful hints because it was difficult.

ここで、非特許文献2にも記されている「折刃式カッターナイフ」を具体例として取り上げ、上記の課題について説明する。具体的には、「折刃式カッターナイフ」に関する課題を「鋭い刃を保つ」という課題テキストとして捉え、この課題テキストに対し、例えば、「違う向きを合わせる」や「違う長さを合わせる」というヒントを得たという場合を例にとり、より具体的に説明する。   Here, the above-described problem will be described by taking a “folded blade type cutter knife” described in Non-Patent Document 2 as a specific example. To be specific, the subject related to the "folding blade type cutter knife" is regarded as a subject text "Keeping a sharp blade", and for this subject text, for example, "Adjusting in a different direction" or "Adjusting a different length" This will be described more specifically by taking an example in which a hint has been obtained.

図2は、前者のヒント「違う向きを合わせる」というヒントに基づいて発想したアイデア「回転刃式カッターナイフ」に関する発想支援事例である。また、図3は、後者のヒント「違う長さを合わせる」というヒントに基づいて発想したアイデア「多重カッターナイフ」に関する発想支援事例である。 FIG. 2 is an example of an idea supporting example of an idea “rotary blade type cutter knife” which is conceived based on the former hint of “matching different directions”. FIG. 3 is an idea supporting example regarding the idea “multiple cutter knives” conceived based on the latter hint “match different lengths”.

図2および図3より明らかなように、前者のヒントからは、「折刃式カッターナイフ」とは別の形態の解決案を発想することが可能であり、また、後者のヒントによる「多重カッターナイフ」の発想からは「折刃式カッターナイフ」の発想へとつなげることが可能である。 As apparent from FIGS. 2 and 3, from the former hint, it is possible to conceive a solution of a different form from the “folded-cutter knife”, and the “multi-cutter” by the latter hint. The idea of "knives" can be linked to the idea of "folding blade type knife".

このように、一見、関連性のないようなヒント「違う向きを合わせる」や「違う長さを合わせる」を得ることによっても、有効に発想を支援することができると言える。しかしながら、従来のアナロジーでは、このような、柔軟で幅広いヒントを得ることは一般には難しいという課題があった。 In this way, it can be said that the seemingly unrelated hints “Adjust different directions” and “Adjust different lengths” can effectively support the idea. However, the conventional analogy has a problem that it is generally difficult to obtain such a flexible and wide hint.

また、抽象的な「こと」を対象とする事例として、「新たなアイデアを生み出す」という課題テキストを考えることとする。この課題テキストに対し、「明確な動機を与える」というヒントを得た場合を考える。   In addition, as an example for abstract “things”, let's consider an issue text “creating new ideas”. Consider a case in which a hint "Give clear motivation" is obtained for this task text.

「新たなアイデアを生み出す」ことを求められたとき、「なんでもいいから」「新たなアイデアを生み出す」ことを求められる場合よりも、「〜という動機・目的のために」「新たなアイデアを生み出す」ことを求められる場合の方が、一般に「アイデアを生み出す」発想は促進されると言える。 When asked to "create a new idea", it is better to "create a new idea" than for "whatever is good" or "to create a new idea". In general, it can be said that the idea of "creating ideas" is promoted when it is required to do so.

このように、「新たなアイデアを生み出す」という「こと」と構造的な類似性のほとんどない「明確な動機を与える」というヒントを得ることによっても、有効に発想を支援することができると言える。しかしながら、従来のアナロジーでは、このような抽象的な「こと」に対するヒントを得ることは一般に難しいという課題があった。 In this way, it can be said that the idea of "creating a new idea" and the hint of "giving a clear motivation" with little structural similarity can also be supported effectively. . However, the conventional analogy has a problem that it is generally difficult to obtain a hint for such an abstract "thing".

本発明は、思考の対象となる課題を表した課題テキストと関連し、その課題解決に有効となるテキスト(ヒント)を、語句間のつながり情報を用いて、課題の「対象」に着目するのではなく、「対象」に対する「作用」に着目することによって、従来のアナロジーでは得られなかったより柔軟で幅広いヒント提供を可能とし、そして、使用者の知識・スキルなどに大きく依存することのない思考支援技術を提供することを目的としている。   The present invention focuses on a "target" of a task using textual information (hints) that are effective in solving the task in relation to the task text representing the task to be considered. Instead of focusing on the "effect" on the "object", it is possible to provide more flexible and broader hints than was possible with conventional analogies, and thinking that does not greatly depend on the knowledge and skills of the user It aims to provide assistive technology.

このような目的を達成するために、本発明にかかわる思考支援システムは、語句間のつながりに関する情報を備え、該情報を用いて、思考の対象となるテキストである入力テキストの「作用」を表すヲ格の近傍に位置するヲ格近傍語句組を、関連性の高い語句の組である関連ヲ格近傍語句組へ変換し、該関連ヲ格近傍語句組に関する情報も用いて前記ヲ格を関連性の高い関連ヲ格に変換することにより、入力テキストに関連するテキストを得られるように構成されている。   In order to achieve such an object, a thinking support system according to the present invention includes information on a connection between words and phrases, and uses the information to represent an “action” of an input text that is a text to be thought. A case pair near the case is converted into a related case group that is a set of highly relevant words, and the case is related using information on the related case group. By converting to a highly relevant category, a text related to the input text can be obtained.

また、本発明にかかわる思考支援システムは、語句間のつながりに関する分散表現形式の情報を含む語句間のつながりに関する情報を備え、該情報を用い、特に分散表現形式の情報を元にもつ空間における平行移動性に関する指標も用いて、思考の対象となるテキストである入力テキストの「作用」を表すヲ格の近傍に位置するヲ格近傍語句組を、関連性の高い語句の組である関連ヲ格近傍語句組へ変換し、該関連ヲ格近傍語句組に関する情報も用いて前記ヲ格を関連性の高い関連ヲ格に変換することにより、入力テキストに関連するテキストを得られるように構成されている。 In addition, the thinking support system according to the present invention includes information about connections between words and phrases including information in a distributed expression format regarding the connections between words and words, and uses the information to perform parallel processing in a space having information based on the distributed expression format in particular. Using the index related to mobility, the word group that is located near the case that represents the “action” of the input text, which is the text to be thought, is converted to the related word group that is a highly relevant word set. It is configured such that a text related to the input text can be obtained by converting the case into a related word set and converting the case into a highly relevant case using the information on the related case group. I have.

また、本発明にかかわる思考支援システムは、ヲ格の近傍に位置する語句であるヲ格近傍語句と名詞句とのつながりに関する情報を含む語句間のつながりに関する情報を備え、該情報を用い、思考の対象となるテキストである入力テキストの「作用」を表すヲ格の近傍に位置するヲ格近傍語句組を、特に前記ヲ格に含まれる名詞句と該ヲ格の近傍に位置するヲ格近傍語句との共起性に関する指標も用いることにより、関連性の高い語句の組である関連ヲ格近傍語句組へ変換ことにより、入力テキストに関連するテキストを得られるように構成されている。 In addition, the thinking support system according to the present invention includes information on a connection between phrases including information on a connection between a noun phrase and a noun phrase that is a phrase located in the vicinity of a noun, and uses the information to perform a thinking process. The word set near the case that is located near the case that represents the “action” of the input text that is the target text of the text is, in particular, the noun phrase contained in the case and the case that is located near the case. By using an index relating to co-occurrence with a phrase, a text related to the input text can be obtained by converting the phrase into a phrase set having a high degree of relevance, which is a pair of highly relevant phrases.

また、本発明にかかわる思考支援システムは、ヲ格の近傍に位置する語句であるヲ格近傍語句と名詞句とのつながりに関する情報と、語句間のつながりに関する分散表現形式の情報とを含む語句間のつながりに関する情報を備え、該情報を用い、思考の対象となるテキストである入力テキストの「作用」を表すヲ格の近傍に位置するヲ格近傍語句組を、特に前記ヲ格に含まれる名詞句と該ヲ格の近傍に位置するヲ格近傍語句との共起性に関する指標、および前記分散表現形式の情報を元にもつ空間における平行移動性に関する指標も用いることにより、関連性の高い語句の組である関連ヲ格近傍語句組へ変換し、該関連ヲ格近傍語句組に関する情報も用いて前記ヲ格を関連性の高い関連ヲ格に変換することにより、入力テキストに関連するテキストを得られるように構成されている。 In addition, the thinking support system according to the present invention is a system which includes information on a connection between a noun phrase and a noun phrase, which is a phrase located in the vicinity of a noun, and information in a distributed expression form on a connection between the words. Using the information, and using the information, a set of words near the case that is located near the case that represents the “action” of the input text that is the text to be considered, particularly the nouns included in the case By using an index relating to co-occurrence of a phrase and a phrase near a ヲ case located in the vicinity of the 、 case, and an index related to parallel movement in a space based on the information of the distributed representation form, a phrase having a high relevance is used. By converting the case into a related case with high relevance using information about the related case-neighboring word / phrase set as well as the text related to the input text. It is configured to obtain a list.

また、本発明にかかわる思考支援システムは、ヲ格の近傍に位置する語句であるヲ格近傍語句と名詞句とのつながりに関する情報と、語句間のつながりに関する分散表現形式の情報とを含む語句間のつながりに関する情報を備え、該情報を用い、思考の対象となるテキストである入力テキストの「作用」を表すヲ格の近傍に位置するヲ格近傍語句組を、特に前記ヲ格に含まれる名詞句と該ヲ格の近傍に位置するヲ格近傍語句との共起性に関する指標、および前記分散表現形式の情報を元にもつ空間における平行移動性に関する指標も用い、前記ヲ格の情報は用いずに関連性の高い語句の組である関連ヲ格近傍語句組へ変換し、該関連ヲ格近傍語句組に関する情報も用いて前記ヲ格を関連性の高い関連ヲ格に変換することにより、入力テキストに関連するテキストを得られるように構成されている。 In addition, the thinking support system according to the present invention is a system which includes information on a connection between a noun phrase and a noun phrase, which is a phrase located in the vicinity of a noun, and information in a distributed expression form on a connection between the words. Using the information, and using the information, a set of words near the case that is located near the case that represents the “action” of the input text that is the text to be considered, particularly the nouns included in the case An index relating to co-occurrence of a phrase and a phrase located in the vicinity of the case, and an index relating to parallel movement in a space based on the information of the distributed expression form are also used. By converting to a related ヲ case neighborhood phrase set that is a set of highly relevant terms, and by using the information about the related 近 傍 case neighborhood phrase set to convert the に case into a highly relevant related case, Input text And it is configured so as to obtain the relevant text.

また、本発明にかかる思考支援プログラムは、コンピュータを、前述した思考支援システムを構成する各手段として機能させるためのプログラムである。   A thinking support program according to the present invention is a program for causing a computer to function as each unit configuring the above-described thinking support system.

また、本発明にかかる思考支援プログラム記憶媒体は、前記思考支援プログラムを記憶したコンピュータ読み込み可能なプログラム記憶媒体である。   Further, a thinking support program storage medium according to the present invention is a computer-readable program storage medium storing the thinking support program.

また、本発明にかかる思考支援情報記憶媒体は、語句間のつながり情報のうち少なくともヲ格に含まれる名詞句とその近傍に位置する語句とのつながりに関する情報を記憶したコンピュータ読み込み可能な情報記録媒体である。   Further, a thinking support information storage medium according to the present invention is a computer-readable information storage medium storing information relating to a connection between at least a noun phrase included in a case and a phrase located in the vicinity of the noun phrase included in the connection information between the phrases. It is.

本発明によれば、思考の対象となる課題を表した課題テキストに対して、従来のアナロジーにおける「対象」との構造的な類似性に基づくヒントの提供に限定されることなく、さらには、思考の対象を具体的な「もの」のみでなく抽象的な「こと」にまでも広げた、より柔軟で幅広いヒントの提供を、使用者の知識・スキルなどに大きく依存することなく、比較的容易に実現できるという効果を奏する。 According to the present invention, a task text representing a task to be considered is not limited to providing a hint based on structural similarity to a “target” in a conventional analogy. Providing more flexible and wide-ranging hints that expands the scope of thinking not only to concrete "things" but also to abstract "things" without relying heavily on the knowledge and skills of users There is an effect that it can be easily realized.

思考支援システムの構成を示すブロック図である。It is a block diagram showing composition of a thought support system. 「鋭い刃を保つ」という課題に対する発想支援事例(「回転刃式カッターナイフ」)である。This is an idea support example (“rotary blade type cutter knife”) for the problem of “keeping a sharp blade”. 「鋭い刃を保つ」という課題に対する発想支援事例(「多重カッターナイフ」)である。This is an idea support example (“multi-cutter knife”) for the problem of “keeping a sharp blade”. 思考支援システムの入力画面表示例である。It is an input screen display example of a thinking support system. 思考支援システムにおける処理を示すフローチャートである。It is a flowchart which shows a process in a thinking support system. 思考支援システムの入力画面表示例である。It is an input screen display example of a thinking support system. 分散表現空間における平行移動性の説明図である。FIG. 4 is an explanatory diagram of parallel movement in a distributed expression space. 思考支援システムの出力画面表示例である。It is an example of an output screen display of a thinking support system. 思考支援システムの出力画面表示例である。It is an example of an output screen display of a thinking support system.

[発明の原理]
アナロジーは、「対象」に着目し、その「対象」を構造的な類似性の高い他の「対象」へと変換を行うことにより思考支援を行う手法である。しかしながら、その「対象」に着目するが故に、より柔軟で幅広いヒントを提供することを難しくしているという一面もある。
[Principle of the invention]
The analogy is a method of supporting thinking by paying attention to an "object" and converting the "object" to another "object" having a high structural similarity. However, there is one side that it is difficult to provide more flexible and broad hints because of focusing on the "object".

そのため、本発明は、「対象」それ自身よりも対象への「作用」に着目し、その「作用」を関連性の高い他の「作用」へと変換を行うことにより、より柔軟で幅広いヒントを提供しようとするものである。 Therefore, the present invention focuses on the "action" of the object rather than the "object" itself, and converts the "action" to another "action" that is more relevant, thereby providing a more flexible and broader hint. It is intended to provide.

また、その「作用」の変換においても、「作用」自体の構造的類似性には着目せず、「作用」を構成している語句のつながりに着目して変換を行うことにより、より柔軟で幅広いヒントを提供しようとするものである。 Also, in the conversion of the “action”, the conversion is performed not by focusing on the structural similarity of the “action” itself, but by focusing on the connection of the words constituting the “action”, thereby providing more flexibility. It seeks to provide a wide range of tips.

以下、詳細に説明していく。まずは、「作用」について説明する。   The details will be described below. First, the “action” will be described.

「作用」は、課題を表す課題テキストにおいて、「対象」を表すヲ格の近傍に位置する語句組(ここでは「組」は「順序組」を意味し、「対(順序対)」も含める)であるヲ格近傍語句組により表されているといえる。前述の「鋭い刃を保つ」という課題テキストにおいては、ヲ格は<刃を>となり、ヲ格近傍語句組は(<鋭い>、<保つ>)という語句組となる。(ここでは、語句は区別を容易にするために鍵括弧<>で囲み表す。) “Action” refers to a word / phrase set located in the vicinity of a case that represents “target” in a task text that represents a task (here, “pair” means “ordered pair” and also includes “pair (ordered pair)”) ) Can be said to be represented by a set of ヲ case neighborhood phrases. In the above-mentioned task text “Keep the sharp blade”, the ヲ case becomes <the blade>, and the ヲ case neighborhood phrase set becomes the phrase set (<sharp>, <keep>). (Here, terms are enclosed in angle brackets <> to facilitate distinction.)

このヲ格近傍語句組を、関連性の高い他の語句組である関連ヲ格近傍語句組へと変換することにより、「作用」の変換を実現することができる。「鋭い刃を保つ」から「違う向きを合わせる」、「違う長さを合わせる」というヒントの提示については、(<鋭い>、<保つ>)というヲ格近傍語句組から(<違う>、<合わせる>)という関連ヲ格近傍語句組への変換とみることができる。(この例では1対1の対応となっているが、1対多の対応、すなわち、複数の語句組への変換も、ここで述べる変換に含まれる。) By converting this set of case-sensitive words and phrases into a related case-related word set, which is another highly relevant word set, conversion of “action” can be realized. As for the hint presentation of "keep sharp edge", "adjust different directions", and "adjust different lengths", please refer to the (<sharp>, <keep>) It can be regarded as a conversion to a related {case-related phrase set}. (In this example, there is a one-to-one correspondence, but a one-to-many correspondence, that is, conversion to a plurality of word sets is also included in the conversion described here.)

なお、ヲ格は「作用の対象」(ここでは、「動作の対象」「心的活動の対象」などを含める)を表す他に、「空間的な経過域」、「時間的な経過域」などを表す場合もある。例えば、「川を泳いで渡った」の<川を>、「お正月を実家で過ごした」の<お正月を>などを挙げることができる(非特許文献9など参照)。したがって、本発明におけるヲ格はこのようなヲ格を除いても構わない。   In addition, in addition to representing "object of action" (here, "object of movement", "object of mental activity", etc.), "square transition area", "temporal transition area" In some cases, it may be expressed. For example, <the river> of "swim across the river" and "the new year" of "I spent the New Year at home" can be cited (see Non-Patent Document 9 and the like). Therefore, the specification in the present invention may exclude such a specification.

また、その一方で、ヲ格ではないが、ヲ格と同一視することができるものもある。例えば、受動態「課題は解決された」は能動態「課題を解決した」と言い換えることができ、<課題は>は<課題を>というヲ格と同一視できる。   On the other hand, some are not qualified, but can be identified with qualified. For example, the passive voice "the problem was solved" can be rephrased as the active voice "the problem was solved", and the <problem> can be equated with the qualification <problem>.

別の例として、複合名詞「概念学習」は「概念を学習すること」と言い換えることができ、複合名詞を形成する名詞<概念>は<概念を>というヲ格と同一視できる。さらには、「N1のN2」タイプである「技術の導入」は「技術を導入すること」と言い換えることができ、<技術の>は<技術を>というヲ格と同一視できる。 As another example, the compound noun "learning the concept" can be paraphrased as "learning the concept", and the noun <concept> forming the compound noun can be equated with the ヲ case of <concept>. Furthermore, "introduction of technology" of the "N1 N2" type can be rephrased as "introduction of technology", and <technical> can be equated with <technical>.

このように、言い換えによりヲ格と同一視できるさまざまな語句や格などが存在する。したがって、このような語句や格などを言い換えたヲ格を、本発明におけるヲ格に含めても構わない。 As described above, there are various words and cases that can be identified with paraphrases in other words. Therefore, a case in which such a phrase or case is paraphrased may be included in the case in the present invention.

以上、説明したように言い換えによりヲ格と同一視できるさまざまな語句や格などが存在する。そのような言い換えも含めたテキストにおけるヲ格が「対象」を表し、そのヲ格の近傍に位置する語句の組であるヲ格近傍語句組が「作用」を表すといえる。   As described above, there are various words and cases that can be identified with paraphrases by paraphrasing. It can be said that the case in the text including such paraphrases represents "object", and the case set near the case, which is a set of words located near the case, represents "action".

次に、語句間のつながりに関する情報を用いた「作用」の変換、すなわち、課題テキストに含まれるヲ格近傍語句組の変換について説明する。   Next, a description will be given of the conversion of the “action” using the information on the connection between the phrases, that is, the conversion of the ヲ case neighborhood phrase set included in the assignment text.

まず、語句間のつながりに関する情報について説明する。語句間のつながりに関する情報には、さまざまな種類がある。そして、それらの情報の形式としては、局所表現と分散表現という2つ形式に大別することができる。 First, information regarding the connection between phrases will be described. There are various types of information about the connection between phrases. The information formats can be broadly divided into two formats, a local expression and a distributed expression.

局所表現形式や分散表現形式の情報においてはベクトルがよく用いられる。(ここでは、ベクトルは、列ベクトルもしくは行ベクトルのことを表し、行列などの線形性を表す対象は含めないものとする。)そのベクトルの特徴量である次元を用いて2つの形式を表せば、局所表現形式とは1つの語句に1つの次元を対応させた表現形式であり、分散表現形式とは複数の語句に複数の次元を対応させた表現形式であるといえる。   Vectors are often used for information in the local expression format and the distributed expression format. (Here, a vector represents a column vector or a row vector, and does not include an object representing linearity such as a matrix.) If two types are represented using a dimension which is a feature amount of the vector, The local expression form is an expression form in which one word corresponds to one dimension, and the distributed expression form is an expression form in which a plurality of words correspond to a plurality of dimensions.

局所表現形式、分散表現形式の順に、語句間のつながりに関する情報について説明する。はじめに、局所表現形式の語句間のつながりに関する情報について説明する。   Information regarding the connection between words will be described in the order of the local expression form and the distributed expression form. First, information on the connection between words in the local expression form will be described.

ここでは、2つの語句WiとWjとの間のつながりに関する情報を語句間つながり情報R(Wi, Wj)と表す。語句間つながり情報R(Wi, Wj)としては、以下のようなさまざまな情報を利用することができる。 Here, information on the connection between the two words Wi and Wj is expressed as inter-phrase connection information R (Wi, Wj). As the inter-phrase connection information R (Wi, Wj), the following various information can be used.

例えば、2つの語句Wi、Wjに関して、同一文章内における共起の有無・頻度など、固定長ウィンドウ内における共起の有無・頻度(ウィンドウのサイズを前後n単語とする単語n-gramなど)など、係り受け関係の有無・頻度など、特定係り受け関係の有無・頻度など、等々のさまざまな語句間のつながり情報をR(Wi, Wj)として利用することができる。 For example, for two phrases Wi and Wj, the presence / frequency of co-occurrence in the same sentence, and the presence / frequency of co-occurrence in a fixed-length window (word n-gram with window size of n words before and after) In addition, connection information between various phrases such as presence / absence / frequency of a dependency relationship and presence / absence / frequency of a specific dependency relationship can be used as R (Wi, Wj).

さらに、これらの情報R(Wi, Wj)を(i,j)成分とする行列を考えることができる。例えば、2つの語句Wi, Wjに関する同一文章内における共起の頻度をR(Wi, Wj)とすると、それは語句の共起行列と呼ばれるものとなる。語句がn種類あるとすれば、この行列はn次正方行列となる。このような行列形式として情報を記憶させ利用することもできる。   Further, a matrix having the information R (Wi, Wj) as an (i, j) component can be considered. For example, assuming that the frequency of co-occurrence of two words Wi and Wj in the same sentence is R (Wi, Wj), it is called a co-occurrence matrix of words. If there are n types of words, this matrix is an n-th order square matrix. Information can be stored and used as such a matrix format.

しかしながら、語句の種類が増加すると、行列の次元が増加し、巨大で疎な行列(成分の多くが0となる行列)となる。巨大で疎な行列を扱う場合には、記憶容量や計算量も増加するという問題が生じる。この問題を解決する1つの方法として、次元を圧縮する方法がある。具体的には、特異値分解(SVD)、主成分分析(PCA)などを用いて次元圧縮を行うことができる。   However, as the types of phrases increase, the dimensions of the matrix increase, resulting in a large and sparse matrix (a matrix in which many of the components are 0). When dealing with a large and sparse matrix, there is a problem that the storage capacity and the amount of calculation increase. One way to solve this problem is to compress dimensions. Specifically, dimensional compression can be performed using singular value decomposition (SVD), principal component analysis (PCA), or the like.

このように次元圧縮をした情報は、1つの語句に1つの次元は対応しておらず、複数の語句に複数の次元が対応しており、分散表現形式の情報であるといえる。このような分散表現形式の情報をつくる手法は、特異値分解(SVD)、主成分分析(PCA)以外にもWord2Vec、GloVeなどの手法(非特許文献3〜6参照)などがある。   Information that has been dimensionally compressed in this way does not correspond to one word but one dimension, and a plurality of words corresponds to a plurality of dimensions, and can be said to be information in a distributed expression format. Methods for creating such information in the distributed representation format include methods such as Word2Vec and GloVe (see Non-Patent Documents 3 to 6) in addition to singular value decomposition (SVD) and principal component analysis (PCA).

以上述べてきた分散表現形式の情報においては、各語句に対応する情報はベクトルである。しかしながら、ベクトルの他にもさまざまな種類の分散表現形式の情報が利用できる(非特許文献10参照)。具体的には、行列、テンソル、そしてベクトルと行列の組などである。   In the information in the distributed expression format described above, the information corresponding to each word is a vector. However, various types of information in a distributed representation format other than the vector can be used (see Non-Patent Document 10). Specifically, there are a matrix, a tensor, and a set of a vector and a matrix.

次に、これらのさまざまな語句間のつながり情報を用いた「作用」の変換方法について説明する。「作用」の変換とは、具体的には、課題テキストにおける「作用」を表すヲ格近傍語句組を関連性の高い語句組である関連ヲ格近傍語句組に変換することである。すなわち、ある語句組を関連する他の語句組に変換することであるといえる。はじめに、語句を関連する他の語句に変換する方法について説明し、その後、語句組を関連する他の語句組に変換する方法について説明する。   Next, a method of converting “action” using connection information between these various phrases will be described. Specifically, the conversion of “action” is to convert a ヲ case neighborhood phrase set representing “action” in a task text into a related ヲ case neighborhood phrase set that is a highly relevant phrase set. That is, it can be said that a certain phrase set is converted into another related phrase set. First, a method of converting a phrase into another related phrase will be described, and then a method of converting a phrase set into another related phrase set will be described.

語句を関連する他の語句に変換する方法について以下説明する。まず、局所表現形式の情報について説明し、次に、分散表現形式の情報について説明する。   A method for converting a phrase into another related phrase will be described below. First, information in the local expression format will be described, and then information in the distributed expression format will be described.

局所表現形式の語句間つながり情報として、例えば、R(Wi,Wj)を同一文章内における2つの語句Wi, Wjの共起の有無(有:1、無:0)とした場合、語句全体の集合をΣとすると、語句Wiと共起する語句の集合Aおよび語句Wjと共起する語句の集合Bは、語句間つながり情報R(Wi,Wj)を用いて、

Figure 2020035010

と表すことができる。 For example, if R (Wi, Wj) is the presence / absence of co-occurrence of two words Wi and Wj in the same sentence (Yes: 1, No: 0) as the local expression form inter-phrase connection information, Assuming that the set is Σ, a set A of terms co-occurring with the term Wi and a set B of terms co-occurring with the term Wj are obtained by using inter-phrase connection information R (Wi, Wj).
Figure 2020035010

It can be expressed as.

これらの語句集合AとBを用いることによって、非特許文献8などに示されるさまざまな類似性・関連性の指標(Cosine類似度、Jaccard係数、φ係数など)を算出することができる。そして、これらの指標の値は語句WiとWjの類似性や関連性を表しているということができる。   By using these word sets A and B, it is possible to calculate various indices of similarity and relevance (Cosine similarity, Jaccard coefficient, φ coefficient, etc.) shown in Non-Patent Document 8 and the like. Then, it can be said that the values of these indices represent the similarity and relevance of the words Wi and Wj.

例えば、Cosine類似度であれば、

Figure 2020035010

を用いて算出することができる(非特許文献8など参照)。ここで、P(A)、P(B)は、それぞれ語句集合A、Bを事象と見做したとき、事象A、Bそれぞれの起こる確率である。また、P(A, B)は、事象AとBの同時確率(事象Aと事象Bがどちらも起こる確率)である。 For example, for Cosine similarity,
Figure 2020035010

(See Non-Patent Document 8, etc.). Here, P (A) and P (B) are the probabilities of occurrence of events A and B, respectively, when word sets A and B are regarded as events. P (A, B) is the simultaneous probability of events A and B (the probability that both events A and B occur).

また、式(2)を集合論的に表現すれば、

Figure 2020035010

となる。ここで、|・|は集合の濃度(元の個数)である。 Also, if Equation (2) is expressed in set theory,
Figure 2020035010

Becomes Here, | · | is the density (original number) of the set.

また、R(Wi,Wj)を行列M(先に述べた共起行列)の(i, j)成分として考え、行列Mの第i行ベクトルと第j行ベクトルをそれぞれベクトルx、yで表すと、それらは語句Wiと語句Wjに対する語句ベクトルと捉えることができる。行列Mをn×nの実正方行列とすれば、ベクトルx、yは

Figure 2020035010

であり、標準内積<・,・>とユークリッドノルム||・||を用いてCosine類似度を表わせば、
Figure 2020035010

となる。 Also, consider R (Wi, Wj) as the (i, j) component of the matrix M (co-occurrence matrix described above), and denote the i-th row vector and the j-th row vector of the matrix M by vectors x and y, respectively. Can be regarded as word vectors for the words Wi and Wj. If the matrix M is an n × n real square matrix, the vectors x and y are
Figure 2020035010

And using the standard inner product <•, •> and the Euclidean norm || • ||
Figure 2020035010

Becomes

さらに、このように共起行列Mの行ベクトル間の内積を用いてCosine類似度を求める方法は、共起の有無のみではなく、共起の頻度情報も扱うことを可能とする。これは、共起行列Mの成分の値0もしくは1(有無情報)を、非負整数(頻度情報)にまで拡張することにより実現できる。   Further, the method of calculating the Cosine similarity using the inner product between the row vectors of the co-occurrence matrix M enables not only the presence / absence of co-occurrence but also co-occurrence frequency information. This can be realized by extending the value 0 or 1 (presence information) of the component of the co-occurrence matrix M to a non-negative integer (frequency information).

ここまで、語句間つながり情報R(Wi,Wj)として、同一文章内の語句の共起情報を例に挙げ説明してきた。語句間つながり情報R(Wi,Wj)は、このような共起情報の他にも前述のようにさまざまな情報を取ることができる。例えば、<連体修飾A>−<名詞N>という修飾・被修飾関係の有無(有:1、無:0)として語句間つながり情報R(A, N)として用いることもできる。(ここでは、<連体修飾部>は<連体修飾語>を包含し、<名詞句>は<名詞>を包含するものとする。)   Up to this point, co-occurrence information of words in the same sentence has been described as the inter-phrase connection information R (Wi, Wj). The inter-phrase connection information R (Wi, Wj) can take various information as described above in addition to such co-occurrence information. For example, it can be used as the inter-phrase connection information R (A, N) as the presence / absence of a modification / modification relation of <Noun modification A>-<Noun N> (Yes: 1, No: 0). (Here, the <unit modifier> includes <unit modifier>, and the <noun phrase> includes <noun>.)

前述の課題テキスト「鋭い刃を保つ」であれば、<鋭い>−<刃>が語句間つながり情報であり、そのヒントである「違う向きを合わせる」および「違う長さを合わせる」では、それぞれ<違う>−<向き>および<違う>−<長さ>が語句間つながり情報となる。このことを語句間つながり情報R(A, N)を用いて表わすと式(6)のようになる。

Figure 2020035010
In the case of the above-mentioned task text "Keep a sharp blade", <Sharp>-<Blade> is word-to-phrase connection information, and the hints "Adjust different directions" and "Adjust different lengths"<Different>-<Orientation> and <Different>-<Length> are inter-phrase connection information. When this is expressed using the inter-phrase connection information R (A, N), the expression (6) is obtained.
Figure 2020035010

このような語句間つながり情報を用いて、例えば、<連体修飾部>の類似性や関連性を算出することもできる。このタイプの語句間つながり情報R(Ai, Nj)を集めたとき、<連体修飾部A>がm種類、<名詞句N>がn種類あったとする。この語句間つながり情報R(Ai, Nj)を特定係り受け関係行列Mの(i, j)成分とすれば、Mはm×nの実行列となる。前述のように特定係り受け関係行列Mの第i行ベクトルを<連体修飾部Ai>の語句ベクトル、第j行ベクトルを<連体修飾部Aj>の語句ベクトルとすることにより、<連体修飾部Ai>と<連体修飾部Aj>との類似性や関連性をさまざまな指標により算出することが可能となる。   For example, the similarity and the relevance of the <unit modification unit> can be calculated using such inter-phrase connection information. Assume that when this type of inter-phrase connection information R (Ai, Nj) is collected, there are m types of <continuous modifier A> and n types of <noun phrase N>. If this inter-phrase connection information R (Ai, Nj) is the (i, j) component of the specific dependency relationship matrix M, M is an m × n execution sequence. As described above, the i-th row vector of the specific dependency relation matrix M is a word vector of the <continuous modifier Ai>, and the j-th row vector is a word vector of the <continuous modifier Aj>. > And <union modification unit Aj> can be calculated using various indices.

<連体修飾部>−<名詞句>の修飾・被修飾の関係も<ヲ格>と<動詞句>の関係のときのように、別の表現形態においても同一視できる関係が存在する。(ここでは、<動詞句>は<動詞>を包含するものとする。)例えば、複合名詞「新人作家」は、<新人の>−<作家>と言い換えることができ、この関係はとりもなおさず、<連体修飾部>−<名詞句>の修飾・被修飾の関係となっている。したがって、本発明でいう<連体修飾部>−<名詞句>の修飾・被修飾の関係に、このような関係を含めても構わない。   There is a relation that can be identified in another expression form, such as the relation between <modification part> -modification / modification of <noun phrase> and <ヲ case> and <verb phrase>. (Here, the <verb phrase> includes the <verb>.) For example, the compound noun “new face writer” can be paraphrased as <new face writer> − <writer>, and this relationship can be restored. In other words, there is a relationship of <modification part>-<noun phrase> modification / modification. Therefore, such a relationship may be included in the relationship between <modification unit>-<noun phrase> in the present invention.

以上、<連体修飾部>−<名詞句>の修飾・被修飾の関係を語句間つながり情報として用いる場合について説明してきたが、このように特定種類の語句間の関係を語句間つながり情報として用いる以外にも、さまざまな語句間の関係を複数用いることも可能である。   As described above, the case where the relation between the modification and the modification of <noun phrase>-<noun phrase> is used as inter-phrase connection information has been described. In this manner, the relation between specific types of words is used as inter-phrase connection information. Besides, it is also possible to use a plurality of relations between various phrases.

例えば、<とても><きれいな><花>というテキストのような<連用修飾部Ad><連体修飾部A><名詞句N>というタイプのテキストにおける関係においては、<連用修飾部Ad>−<連体修飾部A>という関係や、<連用修飾部Ad>−<名詞句N>なども考えることができる。   For example, in a relationship of text of the type <continuous modifier Ad> <continuous modifier A> <noun phrase N> such as <very> <clean> <flower>, <continuous modifier Ad>-< It is also possible to consider a relation such as "continuous modifier A" or "continuous modifier Ad"-<noun phrase N>.

また、<課題を><根本的に><解決する>というテキストのような<ヲ格N><連用修飾部Ad><動詞句V>というタイプのテキストにおける関係においても、<ヲ格N>−<動詞句V>という関係の他に、<ヲ格N>−<連用修飾部V>という関係も用いることができる。 Also, in relations to texts of the type <ヲ case N> <continuous modifier Ad> <verb phrase V>, such as the texts <task> <fundamental> <solve>, <ヲ case N> In addition to the relationship <-verb phrase V>, a relationship << case N>-<continuous modifier V> can also be used.

さらには、<原因を><明らかにする><こと><によって><課題を><根本的に><解決する>という複雑な構造のテキストのような<ヲ格N1><動詞句V1><こと><によって><ヲ格N2><副詞句Ad><動詞句V2>というタイプのテキストにおける関係においては、<ヲ格N1>−<動詞句V2>という関係や、<動詞句V1>−<ヲ格N2>という関係など、具体的には、<原因を>−<解決する>や<明らかにする>−<課題を>という関係なども用いることができる。 Furthermore, it is like a complex structured text of <cause> <clarify> <thing> <by> <task> <fundamental> <solve> <ヲ case N1> <verb phrase V1> In relations in texts of the type <koto> <by> <ヲ case N2> <adverb phrase Ad> <verb phrase V2>, the relationship <ヲ case N1> − <verb phrase V2> or <verb phrase V1> More specifically, a relationship such as-<ヲ N2> or the like, specifically, <cause>-<solve> or <clarify>-<assignment> can be used.

また、<ヲ格N1><動詞句V1><こと><によって><ヲ格N2><副詞句Ad><動詞句V2>というタイプの関係の他にも、<こと><によって>を<こと><で>に置き換えたり、<て>に置き換えたりした同様の意味をもつテキストも存在する。具体的には、「原因を明らかにすることで課題を根本的に解決する」や「原因を明らかにして課題を根本的に解決する」に対応する。このような同様の意味をもつ異なるタイプのテキストにおける<動詞句V1>−<ヲ格N2>関係なども同種の関係として含めても構わない。 Also, besides the relation of the type <ヲ case N1> <verb phrase V1> <thing> <by> <ヲ case N2> <adverb phrase Ad> <verb phrase V2>, <thing> <by> < There are also texts with similar meanings that are replaced with <to> or <to>. Specifically, it corresponds to "solving the problem fundamentally by clarifying the cause" and "solving the problem fundamentally by clarifying the cause". Such <verb phrase V1>-<@ case N2> relations in different types of texts having the same meaning may be included as the same kind of relation.

Cosine類似度やJaccard係数などは、2つの変数に対する対称式により定義されており、その指標は対称的である。しかし、一般に関連性を考えるとき、その非対称性も考慮することが必要となる場合がある。例えば、「特許を出願する」という「作用」と「書類を提出する」という「作用」について考えるとき、「特許を出願する」という「作用」は「書類を提出する」という「作用」に関連するが、「書類を提出する」という「作用」は「特許を出願する」という「作用」に関連するとは一般には言い難い。このような場合における関連性を考えるときには、その非対称性も含めて評価できる関連性の指標も用いることができる。   Cosine similarity and Jaccard coefficient are defined by symmetric expressions for two variables, and the index is symmetric. However, in general, when considering relevance, it may be necessary to consider its asymmetry. For example, when considering the "action" of "applying a patent" and the "action" of "submitting documents", the "action" of "applying a patent" is related to the "action" of "submitting documents". However, it is generally difficult to say that the "action" of "submitting documents" is related to the "action" of "applying a patent". When considering relevance in such a case, a relevance index that can be evaluated including its asymmetry can also be used.

非対称的な類似性・関連性を表す指標としては、補完類似度(非特許文献7など参照)、などがある。補完類似度を、式(3)で用いた集合A、Bの濃度(元の個数)を用いて表わせば、

Figure 2020035010

となる。この場合、全体集合の濃度が大きくなると、全体集合に対する各集合の濃度比が一定であっても、補完類似度の値も大きくなるという性質を持っているので、例えば、全体集合の濃度で除して式(8)のような指標を用いてもよい。
Figure 2020035010
Indices indicating asymmetric similarity / relationship include complementary similarity (see Non-Patent Document 7 and the like). If the complementary similarity is expressed by using the density (the original number) of the sets A and B used in Expression (3),
Figure 2020035010

Becomes In this case, if the density of the whole set increases, the value of the complementary similarity also increases, even if the density ratio of each set to the whole set is constant. Then, an index such as Expression (8) may be used.
Figure 2020035010

この補完類似度は、もともとは「かすれ」や「よごれ」のある劣化印刷文字の認識するために提案されたものであり、それを、1対多関係の類似度に応用した事例が非特許文献7などに記されている。補完類似度の性質上、本発明において、集合Aの表す語句から集合Bの表す語句への変換の指標として補完類似度を用いる場合には、集合Aと集合Bを入れ換えて用いることができる。この入れ換えは、式(7)および(8)ではbとcを入れ換えることに相当する。   This complementary similarity was originally proposed for recognizing deteriorated printed characters having "blurred" or "dirty", and a case where the similarity was applied to the similarity of a one-to-many relationship is described in Non-Patent Document. 7 and the like. Due to the nature of the complementary similarity, in the present invention, when the complementary similarity is used as an index of the conversion from the phrase represented by the set A to the phrase represented by the set B, the sets A and B can be used interchangeably. This replacement corresponds to replacing b and c in equations (7) and (8).

以上、局所表現形式の語句間つながり情報を用いた語句間の関連性に関する指標について説明をしてきた。これらの指標に基づきある語句に対して関連性の高い他の語句候補を選択することが可能となる。   In the above, the index regarding the relevance between words and phrases using the word-phrase connection information in the local expression form has been described. Based on these indices, it is possible to select another phrase candidate highly relevant to a phrase.

次に、分散表現形式の語句間のつながり情報を用いた語句を関連する語句に変換する方法について説明する。分散表現形式の語句間つながり情報の多くにおいて、その情報のタイプはベクトルである。以下、情報のタイプがベクトルの場合を例にとって説明する。   Next, a method for converting a phrase using connection information between phrases in a distributed expression format into a related phrase will be described. In many pieces of word-to-phrase connection information in a distributed expression format, the type of the information is a vector. Hereinafter, a case where the type of information is a vector will be described as an example.

分散表現形式の情報はベクトルなので、局所表現形式の情報の場合に説明した式(5)のCosine類似度を用いて、関連性を評価することができる。また、ベクトル空間における語句間のノルムを関連性の指標として用いることもできる。式(5)のCosine類似度ではユークリッドノルムを用いているが、これは2次平均ノルムに相当し、一般に、p次平均ノルムなどを利用することもできる。その他のさまざまなノルムも利用可能である。   Since the information in the distributed expression format is a vector, the relevance can be evaluated using the Cosine similarity of Expression (5) described in the case of the information in the local expression format. Also, the norm between words and phrases in the vector space can be used as an index of relevancy. Although the Euclidean norm is used for the Cosine similarity in Expression (5), this corresponds to the second-order average norm, and in general, a p-order average norm or the like can be used. Various other norms are also available.

次に、局所表現形式の語句間のつながり情報を用いた語句組を関連する語句組に変換する方法について説明する。   Next, a method of converting a phrase set using connection information between phrases in a local expression form into a related phrase set will be described.

以上述べてきた語句間の類似性・関連性の指標は、語句対間の関連性を評価するためにも用いることができる。例えば、語句対Pi=(Wi1,Wi2)とPj=(Wj1,Wj2)との関連性を評価するとき、語句対Pi=(Wi1, Wi2)の2つの語句Wi1、Wi2の両方と共起する語句の集合をA、語句対Pj=(Wj1, Wj2)の2つの語句Wj1、Wj2の両方と共起する語句の集合をBとすれば、前述の式(2)、(7)、(8)などで表されるさまざまな指標を用いても類似性や関連性を表すこともできる。   The index of similarity / relevance between phrases described above can also be used to evaluate the relevance between phrase pairs. For example, when evaluating the relevance of a phrase pair Pi = (Wi1, Wi2) and Pj = (Wj1, Wj2), the phrase phrase Pi = (Wi1, Wi2) co-occurs with both phrases Wi1 and Wi2 Assuming that a set of phrases is A and a set of phrases co-occurring with both of the two phrases Wj1 and Wj2 of the phrase pair Pj = (Wj1, Wj2) is B, the above-described equations (2), (7), and (8) ) Can be used to represent similarity or relevance.

また、3つ以上(n個)の語句組についても、語句組間の類似性や関連性を評価するために、前述の語句間の類似性・関連性に関する指標を用いることができる。例えば、語句組Ti = (Wi1, Wi2, …, Win)、Tj = (Wj1, Wj2, …, Wjn)との関連を評価するとき、これらの語句組から2つの語句を選ぶことにより、前述の方法により、2つの語句対の類似性・関連性を評価することができる。したがって、語句組Ti、Tjから適当な複数の語句対を選び出し、それらの類似性・関連性の指標を総合的に評価することにより、3つ以上(n個)の語句組についても、類似性や関連性を評価することが可能となる。   In addition, for the three or more (n) phrase sets, the above-mentioned index regarding the similarity / relevance between the phrases can be used in order to evaluate the similarity and the relevance between the phrase sets. For example, when evaluating the association with the word sets Ti = (Wi1, Wi2,…, Win) and Tj = (Wj1, Wj2,…, Wjn), by selecting two words from these word sets, By the method, the similarity / relevance of two phrase pairs can be evaluated. Therefore, by selecting appropriate plural pairs of phrases from the phrase sets Ti and Tj and comprehensively evaluating the similarity / relevance index, the similarity can be obtained for three or more (n) phrase sets. And relevance can be evaluated.

Word2Vecなどの分散表現形式の情報では、語句間のアナロジー関係が、語句の分散表現情報を元とする空間(以下、分散表現空間という)における「平行移動」として対応づけ可能であることが知られている(非特許文献4など参照)。そのため、このような分散表現形式の情報も併せて用いる場合には、いままで述べてきた関連性を表すさまざまな指標の他に、平行移動性という指標も併せて用いることができる。   It is known that in the case of information in a distributed expression format such as Word2Vec, the analogy relationship between words can be associated as "translation" in a space based on the distributed expression information of words (hereinafter, referred to as a distributed expression space). (See Non-Patent Document 4, etc.). Therefore, when such information in the distributed representation format is also used, an index of parallel movement can be used in addition to the various indexes indicating the relevance described above.

平行移動性の指標について、簡単な例を用いて説明する。課題テキスト「鋭い刃を保つ」は一般化すれば<連体修飾部A><名詞句N><を><動詞句V>となる。簡単に表せば、課題テキストは<A><N><V>となる。課題テキスト<A><N><V>より変換された関連を有するテキストを<A’><N’><V’>で表し、その変換のイメージを分散表現空間を平面で表すと、平行移動性は図7のような形で表現できる。   The index of parallel movement will be described using a simple example. The task text "Keep a sharp blade" can be generalized as <adjunct modifier A> <noun phrase N> <to> <verb phrase V>. In simple terms, the assignment text is <A> <N> <V>. A text having a relation converted from the task text <A> <N> <V> is expressed as <A '> <N'> <V '>, and the image of the conversion is expressed in a distributed expression space as a plane. The mobility can be expressed in a form as shown in FIG.

図7における<A>、<N>、…、<V’>は対応する語句の分散表現形式の情報、すなわち、語句ベクトルを表している。厳密にいえば、語句ベクトルの視点を分散表現空間の原点に合わせたときの終点の位置に<A>などの記号を配置していることを意味している。各語句<A>、<N>、…、<V’>に対応するベクトルをa、n、…、v’で表すとすると、平行移動性とは、<A>→<A’>、<N>→<N’>、<V>→<V’>の3つの矢印、すなわち3つのベクトルa’−a、n’−n、v’−vの一致度を表しているということができます。すなわち、3つのベクトルa’−a、n’−n、v’−vがなるべく揃うように変換候補<A’><N’><V’>を選択するための指標であるともいえます。   In FIG. 7, <A>, <N>,..., <V ′> represent information in a distributed expression form of a corresponding word, that is, a word vector. Strictly speaking, it means that a symbol such as <A> is arranged at the position of the end point when the viewpoint of the phrase vector is set to the origin of the distributed expression space. Assuming that vectors corresponding to the words <A>, <N>,..., <V ′> are represented by a, n,..., V ′, the parallel movement is represented by <A> → <A ′>, < It can be said that three arrows of N> → <N ′> and <V> → <V ′> indicate the coincidence of three vectors a′−a, n′−n, and v′−v. You. That is, it can be said that it is an index for selecting the conversion candidate <A '> <N'> <V '> so that the three vectors a'-a, n'-n, and v'-v are aligned as much as possible.

以上、述べてきたように、本発明は、語句間のつながりに関する情報を用いて、課題テキストに記載されている「対象」よりも「作用」に着目し、課題テキストに含まれる語句組を関連性の高い語句組である関連語句組に変換する方法であり、特に、語句間の共起性や分散表現情報を元とする空間における平行移動性なども指標として加味する方法も含んでいる。そして、本発明を用いることにより、使用者の知識やスキルへの依存が大きくなく、柔軟で幅広くかつ効果的なヒントを提供することを可能としている。   As described above, the present invention focuses on "action" rather than "object" described in an assignment text, and uses the information on the connection between words to associate a phrase set included in the assignment text. This is a method of converting into a related phrase set that is a highly likely phrase set, and particularly includes a method that takes into account, for example, co-occurrence between words and parallel translation in a space based on distributed expression information as an index. By using the present invention, it is possible to provide a flexible, wide, and effective hint without depending on the knowledge and skills of the user.

次に、本発明の複数の実施形態について図面を参照して説明する。
[思考支援システム(1)]
まず、図1〜5、7〜8を参照して、本実施にかかる思考支援システムについて説明する。
図1は思考支援システムの構成を示すブロック図である。この思考支援システム10は、全体としてコンピュータにより自然言語を用いた情報処理を行う情報処理システムであり、入力された思考の対象となるテキストの一部もしくは全部と関連を持ち、テキストの構造解析により得られたテキストに含まれるヲ格の近傍に位置する語句組であるヲ格近傍語句組について、語句間のつながりに関する情報を用いて、関連性の高い語句組である関連ヲ格近傍語句組へ変換し、該関連ヲ格近傍語句組の情報も用いて、該ヲ格を関連性の高い語句である関連ヲ格へ変換して得られる関連テキストを提示することにより、思考を支援する機能を有している。
Next, a plurality of embodiments of the present invention will be described with reference to the drawings.
[Thinking support system (1)]
First, a thought support system according to the present embodiment will be described with reference to FIGS.
FIG. 1 is a block diagram showing the configuration of the thinking support system. The thinking support system 10 is an information processing system that performs information processing using a natural language by a computer as a whole, has a relationship with a part or all of an input text to be thought, and performs a structural analysis of the text. Using the information on the connection between phrases, the related phrase pair, which is a phrase pair located in the vicinity of the phrase included in the obtained text, is converted into a related phrase pair, which is a highly relevant phrase pair, using information on the connection between the phrases. A function that supports thinking by converting and presenting a related text obtained by converting the case into a related case, which is a highly relevant phrase, by using the information of the related case neighborhood phrase set. Have.

本実施の形態にかかる思考支援システム10には、主な機能部として、操作入力部11、画面表示部12、通信I/F部13、記憶部14、演算処理部15、データベース部16が設けられている。 The thinking support system 10 according to the present embodiment includes an operation input unit 11, a screen display unit 12, a communication I / F unit 13, a storage unit 14, an arithmetic processing unit 15, and a database unit 16 as main functional units. Have been.

操作入力部11は、キーボード、タッチパネルや音声認識装置などの操作入力装置からなり、ユーザの操作を検出して演算処理部15へ出力する機能を有している。画面表示部12は、LCDなどの画面表示装置からなり、演算処理部15からの指示に応じて各種情報を画面表示する機能を有している。また、画面表示装置の他に音声合成装置などの出力装置を備えることも可能である。通信I/F部13は、データ通信用の専用回路からなり、LAN回線や無線回線などを介してデータ通信を行う機能を有している。 The operation input unit 11 includes an operation input device such as a keyboard, a touch panel, and a voice recognition device, and has a function of detecting a user operation and outputting the operation to the arithmetic processing unit 15. The screen display unit 12 is composed of a screen display device such as an LCD, and has a function of displaying various information on the screen according to an instruction from the arithmetic processing unit 15. In addition, an output device such as a speech synthesizer can be provided in addition to the screen display device. The communication I / F unit 13 includes a dedicated circuit for data communication, and has a function of performing data communication via a LAN line, a wireless line, or the like.

記憶部14は、ハードディスクや半導体メモリなどの記憶装置からなり、演算処理部15での各種処理に用いる処理情報14Aやプログラム14Pを記憶する機能を有している。プログラム14Pは、演算処理部15で実行されることにより、演算処理部15と協働して各種の処理部を実現するプログラムであり、外部装置や記憶媒体(ともに図示せず)から予め読み込まれて記憶部14に格納される。 The storage unit 14 is composed of a storage device such as a hard disk or a semiconductor memory, and has a function of storing processing information 14A and a program 14P used for various processes in the arithmetic processing unit 15. The program 14P is a program that, when executed by the arithmetic processing unit 15, implements various processing units in cooperation with the arithmetic processing unit 15, and is read in advance from an external device or a storage medium (both not shown). And stored in the storage unit 14.

データベース部16は、ハードディスクや半導体メモリなどの記憶装置からなり、演算
処理部16での各種処理に用いるデータベースを記憶する機能を有している。データベース部16で記憶する主なデータベースとして、語句間のつながりに関する情報を記憶する語句間つながり情報データベースである。[発明の原理]において説明したさまざまな種類の語句間つながり情報はデータベース部16に格納される。
The database unit 16 is composed of a storage device such as a hard disk or a semiconductor memory, and has a function of storing a database used for various processes in the arithmetic processing unit 16. The main database stored in the database unit 16 is an inter-phrase connection information database that stores information on the connection between words and phrases. The various types of inter-phrase connection information described in [Principle of the Invention] are stored in the database unit 16.

図4は思考支援システムの入力画面表示例であり、図8および図9は思考支援システムの出力画面表示例である。また、図5は思考支援システムの処理を示すフローチャートである。以下、図5のフローチャートの各ステップに沿って説明する。   FIG. 4 shows an input screen display example of the thinking support system, and FIGS. 8 and 9 show an output screen display example of the thinking support system. FIG. 5 is a flowchart showing the processing of the thinking support system. Hereinafter, description will be made along each step of the flowchart of FIG.

はじめに、図5のフローチャートのステップS10「思考対象となるテキストを入力テキストとして取得」について説明する。図4は思考支援システム10の画面表示部12に表示された思考の対象となるテキスト(課題テキスト)の入力ウィンドウを表している。この入力ウィンドウには、操作入力部11のキーボードなどにより入力された思考の対象となるテキストである「鋭い刃を保つ」という文が表示されている。この画面の関連テキスト表示ボタンを操作入力部11のマウスなどを用いてクリック等を行うことにより選択すると、演算処理部15の入力処理部15Aにより「鋭い刃を保つ」という入力テキストを受け取り記憶部14に記憶する。   First, step S10 of the flowchart of FIG. 5 “obtain a text to be considered as input text” will be described. FIG. 4 shows an input window for a text (task text) to be considered displayed on the screen display unit 12 of the thinking support system 10. In this input window, a sentence “Keep the sharp blade”, which is a text to be thought input by the keyboard or the like of the operation input unit 11, is displayed. When the related text display button on this screen is selected by clicking or the like using the mouse or the like of the operation input unit 11, the input processing unit 15A of the arithmetic processing unit 15 receives the input text “Keep sharp blade” and stores the input text. 14 is stored.

次に、図5のフローチャートのステップS11「入力テキストの形態素解析・構造解析を実施」およびステップS12「各ヲ格および各ヲ格近傍語句組を取得」について説明する。ステップS10ののち、構造解析部15Bにより、思考の対象となる入力テキストを形態素解析、構造解析などの自然言語処理技術を利用することにより、<鋭い>−<刃を>、<刃を>−<保つ>という語句間の関係を抽出し、ヲ格として<刃を>を、ヲ格に含まれる名詞句として<刃>を、そして、ヲ格近傍語句組として(<鋭い>、<保つ>)の語句組を、それぞれ特定し、記憶部14に記憶する。ヲ格が複数存在するときには、各ヲ格に対応するヲ格近傍語句組などをそれぞれ特定し、記憶部14に記憶する。   Next, step S11 “perform morphological analysis and structural analysis of input text” and step S12 “acquire each case and each case close phrase set” in the flowchart of FIG. 5 will be described. After step S10, the structural analysis unit 15B uses the natural language processing technology such as morphological analysis and structural analysis to analyze the input text to be considered, so that <sharp>-<blade>, <blade>- The relationship between the phrases <keep> is extracted, and <case> is used as the ヲ case, <blade> is used as the noun phrase included in the ヲ case, and ヲ case is used as a pair of words (<sharp>, <keep> ) Are specified and stored in the storage unit 14. When there are a plurality of ヲ cases, a ヲ case neighborhood word set or the like corresponding to each ヲ case is specified and stored in the storage unit 14.

次に、図5のフローチャートのステップS13「各ヲ格近傍語句組を関連ヲ格近傍語句組へ変換」について説明する。関連語句処理部15Cは、「対象」よりも「作用」に着目して変換を行うため、まず、ヲ格近傍語句組(<鋭い>、<保つ>)を関連性の高い関連ヲ格近傍語句組(<違う>、<合わせる>)などへと変換する処理を行う。この関連ヲ格近傍語句組への変換処理は、ヲ格近傍語句組のうち、<鋭い>、もしくは<保つ>、もしくは(<鋭い>、<保つ>)の組のいずれかの語句もしくは語句組に対して、まず実行される。   Next, step S13 of the flowchart in FIG. 5, “Converting each set of ヲ case neighboring words and phrases to a related ヲ case neighborhood word and phrase set” will be described. Since the related phrase processing unit 15C performs the conversion by focusing on the “action” rather than the “object”, first, the related case phrase pair (<sharp>, <keep>) is highly related to the related {case nearby phrase. A process of converting to a pair (<different>, <match>) or the like is performed. The conversion process to the related ヲ case neighborhood phrase set is performed by any one of the <sharp>, <keep>, or (<sharp>, <keep>) pair or the phrase set in the ヲ case neighborhood phrase set. Is executed first.

ここでは、ヲ格近傍語句組に含まれる<保つ>という<動詞句>に対して、関連語句処理部15Cが最初に関連性の高い語句を取得する場合の例について説明する。このとき、語句間つながり情報データベース16Aには、<連体修飾部>−<名詞句>関係および<ヲ格>−<動詞句>関係の有無に関する局所表現形式の情報である局所表現情報LRDと、<連体修飾部>、<名詞句>、<動詞句>に対応する語句の分散表現形式の情報である分散表現情報DRDとが、少なくとも記憶されているものとする。 Here, an example will be described in which the related phrase processing unit 15C first acquires a phrase having a high relevance for a <verb phrase> of <keep> included in the #case neighborhood phrase set. At this time, the inter-phrase connection information database 16A includes local expression information LRD, which is information in a local expression format regarding the presence or absence of a <adjunct modifier>-<noun phrase> relationship and a <ヲ case>-<verb phrase> relationship, It is assumed that at least at least distributed expression information DRD, which is information of a distributed expression format of a phrase corresponding to the <nominal modifier>, <noun phrase>, <verb phrase>, is stored.

ここで、局所表現情報LRDに記憶されている<連体修飾部>のすべての語句を要素とする集合を集合A、<名詞句>および<ヲ格>(正確には<ヲ格>に含まれる名詞句)のすべて語句を要素とする集合を集合N、<動詞句>のすべて語句を要素とする集合を集合Vとすると、<連体修飾部>−<名詞句>関係に関する情報は集合Aと集合Nの直積集合A×Nの部分集合として表わすことができ、<ヲ格>−<動詞句>関係に関する情報は集合Nと集合Vの直積集合N×Vの部分集合として表わすことができる。 Here, a set including all the phrases of the <union modifier> stored in the local expression information LRD as elements is included in the set A, <noun phrase>, and <ヲ case> (exactly, in <ヲ case>). Assuming that a set of all noun phrases as elements is a set N and a set of all <verb phrases> as elements is a set V, the information on the <adnominal modifier>-<noun phrase> relationship is set A. It can be represented as a subset of the direct product set A × N of the set N, and the information on the <ヲ case> − <verb phrase> relation can be represented as a subset of the direct product set N × V of the set N and the set V.

また、直積集合A×Nの部分集合を、行列を用いて表わす場合には、この部分集合の要素に対応する行列の成分を1とし、それ以外の成分を0とすることで<連体修飾部>−<名詞句>関係を表す|A|×|N|行列を生成することができる。同様にして、<ヲ格>−<動詞句>関係を表す|N|×|V|行列を生成することができる。(ここで|・|は集合の濃度(元の個数)を表すものとする。) Also, when a subset of the direct product set A × N is represented using a matrix, the element of the matrix corresponding to the element of this subset is set to 1 and the other components are set to 0, thereby defining the <union modification unit. | A | × | N | matrix representing the relation>-<noun phrase> can be generated. Similarly, a | N | × | V | matrix representing a <ヲ case>-<verb phrase> relationship can be generated. (Where | · | represents the density (original number) of the set.)

まず、関連語句処理部15Cは、語句間つながり情報データベース16A内に記憶されている局所表現情報LRDの<ヲ格>−<動詞句>関係情報を検索し、<動詞句>=<保つ>という条件を満たす<ヲ格>(に含まれる)を元とする集合である集合N(<保つ>)を取得する。この集合N(<保つ>)は、例えば、N(<保つ>)={<アイデンティティ>、<明るさ>、<アクセント>、…}というような語句の元により構成された集合となっている。なお、処理を簡便にする意味合いもあり、<ヲ格>の集合は、<ヲ格>に含まれる<名詞句>を<ヲ格>の代りに元としている。集合Vを順序組と見做したときに、<保つ>がi番目の成分だとすると、集合N(<保つ>)は、|N|×|V|行列のi列目の列ベクトルに対応する。   First, the related phrase processing unit 15C searches for <ヲ case>-<verb phrase> related information of the local expression information LRD stored in the inter-phrase connection information database 16A, and states that <verb phrase> = <keep>. Acquire a set N (<keep>), which is a set based on (included in) << case> that satisfies the condition. This set N (<keep>) is, for example, a set composed of elements such as N (<keep>) = {<identity>, <brightness>, <accent>, ...} . Note that there is also a meaning to simplify the processing, and the set of <ヲ case> is based on <noun phrase> included in <ヲ case> instead of <ヲ case>. Assuming that <keep> is the i-th component when the set V is regarded as an ordered set, the set N (<keep>) corresponds to the column vector of the i-th column of the | N | × | V | matrix.

この集合N(<保つ>)との関連性の高い集合N(<V>)を、<ヲ格>−<動詞句>関係情報を用いて抽出する。|N|×|V|行列を用いて言えば、i列目の列ベクトルと類似度の高い他の列ベクトルを探す処理であるといえる。類似度・関連性の高い列ベクトルを探す具体的な方法については、既に[発明の原理]で述べた通りであり、さまざまな方法を用いることができる。 A set N (<V>) having a high relevance to this set N (<keep>) is extracted using <ヲ case> − <verb phrase> relation information. Using a | N | × | V | matrix, it can be said that this is a process of searching for another column vector having a high similarity to the column vector of the i-th column. A specific method of searching for a column vector having a high similarity / relevance is as described in [Principle of the Invention], and various methods can be used.

集合N(<保つ>)との関連性の高い集合N(<V>)を探す際に、類似度の高過ぎる集合N(<V>)を選ぶと、ヒントとして、当たり前すぎるものとなってしまう可能性が高い。そのため、図4に示される「関連性閾値」の「max」の値を適当な値にすることにより、類似度の高すぎる集合N(<V>)を除くことを可能としている。また、関連性が低すぎると、ヒントとしての有用性も下がる可能性が高くなるといえる。したがって、図4に示される「関連性閾値」の「min」の値を適当な値にすることにより、関連性の低すぎる集合N(<V>)を除くことも可能としている。この値は、例えば、式(8)に示される補完類似度などを用いて算出された値である。   When searching for a set N (<V>) with a high degree of relevance to the set N (<keep>), if a set N (<V>) with too high similarity is selected, it becomes too obvious as a hint. It is highly possible that Therefore, by setting the value of “max” of the “relevance threshold” shown in FIG. 4 to an appropriate value, it is possible to remove the set N (<V>) having too high a similarity. Also, if the relevance is too low, it can be said that the usefulness as a hint is likely to decrease. Therefore, by setting the value of “min” of the “relevance threshold” shown in FIG. 4 to an appropriate value, it is possible to remove the set N (<V>) having too low relevance. This value is a value calculated using, for example, the complementary similarity shown in Expression (8).

また、図4に示される「平行移動性閾値」の「max」「min」の値の設定を変えることにより、ヒントとして妥当な「平行移動性」の範囲に絞り込むことができる。この「平行移動性」に関する指標としては、図7に示される変換に対応するベクトルに対して、式(5)に示されるようなCosine係数などにより算出された値を用いることができる。   Further, by changing the setting of the “max” and “min” values of the “parallel mobility threshold” shown in FIG. 4, it is possible to narrow down the range of the “parallel mobility” that is appropriate as a hint. As the index relating to the “parallel movement”, a value calculated by a Cosine coefficient or the like as shown in Expression (5) for a vector corresponding to the conversion shown in FIG. 7 can be used.

式(8)の補完類似度を用いてN(<保つ>)と類似度・関連性の高い集合N(<V>)を求めると、例えば、<高める>、<与える>、<変える>、…などの動詞を関連ヲ格近傍語句として得ることができる。   When a set N (<V>) having a high similarity and relevance to N (<keep>) using the complementary similarity of Expression (8), for example, <enhance>, <given>, <change>, Verbs such as ... can be obtained as related ヲ case neighborhood phrases.

[発明の原理]において述べたように、ヲ格近傍語句組を関連ヲ格近傍語句組へ変換する方法として、語句単位で関連性を算出する方法の他にも、語句組として関連性を求めて変換する方法を用いることもできる。 As described in [Principle of the Invention], as a method of converting a ヲ case neighborhood phrase set to a related ヲ case neighborhood phrase set, in addition to a method of calculating relevance in terms of phrases, the relevancy is obtained as a phrase set. A conversion method can also be used.

「鋭い刃を保つ」という課題テキストにおけるヲ格近傍語句組(<鋭い>、<保つ>)を関連ヲ格近傍語句組へと変換する場合について、その変換方法の一実施例について説明する。   A description will be given of an embodiment of a method for converting a case pair (<sharp>, <keep>) in a task text "Keep a sharp blade" into a related case pair.

N(<保つ>)と同様に、<連体修飾部>−<名詞句>の関係情報より、<連体修飾部>=<鋭い>という条件を満たす<名詞句>の集合をN(<鋭い>)と表すこととする。また、<鋭い>の修飾する<名詞句>の集合N(<鋭い>)と<保つ>がヲ格としてもつ<名詞句>の集合N(<保つ>)との共通部分N(<鋭い>)∩N(<保つ>)をN(<鋭い>、<保つ>)と表すとする。   Similarly to N (<Keep>), a set of <Noun phrases> satisfying the condition <Continuous modifier> = <Sharp> is defined as N (<Sharp>) from the relation information of <Adnominal modifier>-<Noun phrase>. ). Also, a common part N (<sharp>) of a set N (<sharp>) of <noun phrases> to be modified by <sharp> and a set N (<keep>) of <noun phrases> that <keep> has as a ヲ case ) ∩N (<keep>) is represented as N (<sharp>, <keep>).

このN(<鋭い>、<保つ>)と類似度・関連性の高い他のN(<A>、<V>)をもつ、ヲ格近傍語句組(<A>、<V>)が、関連ヲ格近傍語句組の候補となる。前述のN(<保つ>)のときと同様に、式(8)に示すような補完類似度により関連性の高い関連ヲ格近傍語句組(<A>、<V>)を求めると、(<静かな>、<与える>)、(<違う>、<合わせる>)、(<違う>、<生かす>)、…などの関連ヲ格近傍語句組の候補を得ることができる。   A ヲ case neighborhood phrase set (<A>, <V>) having another N (<A>, <V>) with high similarity and relevance to this N (<sharp>, <keep>) It is a candidate for the related ヲ case neighborhood phrase set. Similarly to the case of N (<keep>) described above, when a related ヲ case neighborhood phrase set (<A>, <V>) having a high relevance is obtained by complementary similarity as shown in Expression (8), ( Candidates for related {case-nearby word pairs, such as <quiet>, <given>), (<different>, <fit>), (<different>, <live>), ..., etc. can be obtained.

このような候補の中より、<保つ>→<V>と<鋭い>→<A>が分散表現情報を元とする空間内でなるべく平行移動に近くなるような組(<A>、<V>)を選択することもできる(図7参照)。その選択の指標としては、<保つ>→<V>への平行移動を基準として、<A>への平行移動を評価する方法をとると、以下の式(9)に示すCosine係数を指標とすることもできる。式(9)は、Cosine係数を用いて、ベクトルa0+v1−v0とベクトルa1の類似度を表している。そのため、ベクトルの類似度を算出する他の指標を用いても表すことができる。

Figure 2020035010
Among such candidates, a set (<A>, <V>) in which <keep> → <V> and <sharp> → <A> are as close as possible to translation in the space based on the distributed expression information. >) Can also be selected (see FIG. 7). As an index for the selection, a method of evaluating the parallel shift to <A> based on the parallel shift to <keep> → <V> can be expressed as follows. You can also. Equation (9) expresses the similarity between the vector a0 + v1−v0 and the vector a1 using the Cosine coefficient. Therefore, it can be represented by using another index for calculating the degree of similarity between vectors.
Figure 2020035010

このCosine係数を用いることにより、例えば、前述の(<静かな>、<与える>)、(<違う>、<合わせる>)、(<違う>、<生かす>)、…という語句組の中より、図8の思考支援システムの出力画面表示例に示されるように、Cosine係数の高い(<違う>、<合わせる>)、(<伝わる>、<与える>)、(<伝わる>、<学ぶ>)、…という語句組を関連ヲ格近傍語句組として選択することができる。(この結果は非特許文献6に示されるnwjc2vec(国立国語研究所:分散表現情報)を用いて算出されたものである。)   By using this Cosine coefficient, for example, the words “(quiet), <given>), (<different>, <fit>), (<different>, <live>), etc. As shown in the output screen display example of the thinking support system in FIG. 8, the Cosine coefficient is high (<different>, <match>), (<transmitted>, <given>), (<transmitted>, <learned> ),... Can be selected as a related ヲ case neighborhood phrase set. (This result is calculated using nwjc2vec (National Institute for Japanese Language: Distributed Expression Information) shown in Non-Patent Document 6.)

次に、図5のフローチャートのステップS14「各ヲ格を関連ヲ格へ変換」およびS15「変換したテキストを出力」について説明する。図9は、図8の出力画面表示例において、関連ヲ格近傍語句組として(<違う>、(合わせる>)を選択した際のヲ格の変換候補を表示した出力画面表示例である。このヲ格の変換候補である関連ヲ格は以下のようにして求めることができる。   Next, steps S14 “convert each case into related cases” and S15 “output converted text” in the flowchart of FIG. 5 will be described. Fig. 9 is an output screen display example in which, in the output screen display example of Fig. 8, a conversion candidate of a case when (<no>, (match)) is selected as a related no-case neighborhood phrase set is displayed. Related qualifications, which are candidates for qualification conversion, can be obtained as follows.

関連ヲ格近傍語句組として(<違う>、<合わせる>)を選択した場合、ヲ格を変換する関連ヲ格の候補となるのは、集合N(<違う>)と集合N(<合わせる>)の共通部分であるN(<違う>)∩N(<合わせる>)の元を候補とすることができる。例えば、N(<違う>)∩N(<合わせる>)={<アイテム>、<値>、<意見>、<位置>、<イメージ>、<色>、…}といった集合となる。その候補の中で、関連ヲ格近傍語句組の選択と同様に平行移動性を条件として用いることができる。 When (<No>, <Match>) is selected as the related {case} word pair, the candidates for the related {case} to convert {case} are set N (<no>) and set N (<match>) ), Which is a common part of N (<different>) ∩N (<match>), can be used as a candidate. For example, N (<different>) ∩N (<fit>) = {<item>, <value>, <opinion>, <position>, <image>, <color>,... Among the candidates, the parallel movement can be used as a condition in the same manner as the selection of the related-case-neighboring phrase set.

たとえば、<鋭い><刃を><保つ>→<違う><N(を)><合わせる>という前述の例においては、<鋭い>→<違う>および<保つ>→<与える>という2組の変換に対応する平行移動を基準として、<刃を>→<N(を)>を評価する指標として、以下のようなCosine係数を指標とすることができる(図7参照)。式(10)は、Cosine係数を用いて、ベクトルn0+((v1−v0)+(a1−a0))/2とベクトルn1の類似度を表している。そのため、ベクトルの類似度を算出する他の指標を用いても表すことができる。

Figure 2020035010
For example, in the above example of <sharp><holdblade><keep> → <different><N(a)><match>, two sets of <sharp> → <different> and <keep> → <given> The following Cosine coefficient can be used as an index for evaluating <the blade> → <N (()> based on the parallel movement corresponding to the conversion (see FIG. 7). Equation (10) expresses the similarity between the vector n0 + ((v1-v0) + (a1-a0)) / 2 and the vector n1 using the Cosine coefficient. Therefore, it can be represented by using another index for calculating the degree of similarity between vectors.
Figure 2020035010

式(10)のCosine係数を評価指標として、N(<違う>)∩N(<合わせる>)の元をCosine係数の高い順にならべると、例えば、図9に示されるような<向き>、<角度>、<長さ>、<サイズ>、<方向>、…という関連ヲ格の候補を得ることができる。これらの関連ヲ格の中より、課題テキスト「鋭い刃を保つ」に対するヒントとなりそうな語句を選択することにより、例えば、図2、図3に示したような「違う角度を合わせる」、「違う長さを合わせる」というヒントを得ることができる。   Using the Cosine coefficient of the equation (10) as an evaluation index and arranging the elements of N (<different>) ∩N (<fit>) in ascending order of the Cosine coefficient, for example, as shown in FIG. Related angle candidates such as angle>, <length>, <size>, <direction>, ... can be obtained. By selecting a phrase that is likely to be a hint for the task text “Keep the sharp blade” from among these related cases, for example, as shown in FIG. 2 and FIG. Adjust the length ".

以上の例では、関連性の高い語句組の候補を得るために、語句組の関連性の指標として式(8)に示される補完類似度をベースとした指標を、平行移動性の指標として式(5)、式(9)、式(10)に示されるCosine類似度を用いる場合について説明した。しかしながら、[発明の原理]で説明したように、語句組間の関連性や平行移動性を表す指標にはさまざまな種類の指標を利用することが可能であり、さらには、それらの指標を引数とする関数を新たな指標として用いることも可能であり、本実施形態に限定されるものではない。   In the above example, in order to obtain a highly relevant word / phrase set candidate, the index based on the complementary similarity shown in Expression (8) as the index of the word / phrase relevance is used as the parallel movement index. The case where the Cosine similarity shown in (5), (9), and (10) is used has been described. However, as described in [Principle of the Invention], various types of indices can be used as indices indicating the relevance and parallel movement between word sets, and further, these indices are used as arguments. Can be used as a new index, and the present invention is not limited to this embodiment.

また、本実施形態では、はじめに<動詞句>である<保つ>と関連性の高い他の<動詞句>の候補を得たのちに、<連体修飾部>である<鋭い>と関連性が高く、かつ、平行移動性も高い他の<連体修飾部>の候補を求めているが、はじめに<連体修飾部>の候補を求めてから、<動詞句>である<保つ>と関連性が高く、かつ、平行移動性も高い他の<動詞句>の候補を求めてもよい。さらには、<連体修飾部>と<動詞句>の組(<鋭い>、<保つ>)と関連性の高い他の組の候補を求め、その中から平行移動性の高い組を選択するようにしてもよい。このように、関連語句組の候補を求める手順についても、本実施形態に限定されるものではない。 Further, in this embodiment, after first obtaining other <verb phrase> candidates having high relevance to <keep> which is <verb phrase>, the relevance to <sharp> which is <adjunct modifier> is obtained. We are seeking other candidates for <modification unit> that are high and have high parallelism, but we first find candidates for <modification unit>, and then have a relevance with <keep> which is a <verb phrase> Other <verb phrase> candidates that are high and have high parallel movement may be obtained. In addition, a candidate for another set highly relevant to the set (<sharp>, <keep>) of <adjunct modifier> and <verb phrase> is determined, and a set with high parallel movement is selected from the candidates. It may be. As described above, the procedure for obtaining the related phrase set candidate is not limited to the present embodiment.

[思考支援システム(2)]
次に、図6を参照して、本実施にかかる思考支援システムについて説明する。実施例[思考支援システム(1)]においては、図4に示すように思考対象テキストを文の形式で入力することができた。しかしながら、思考支援システムの使用に慣れていない使用者にとっては、思考対象テキストを自由に入力できることが、逆に思考対象テキストをつくり難くしている場合も想定される。その課題を解決する方法として、例えば、図6に示されるような入力画面を思考支援システムに持たせることにより、入力テキストの前処理をより簡便にするとともに、思考支援システムの使用に慣れていない使用者に対して思考対象テキスト作成を行い易くすることもできる。入力テキストの前処理が簡便になったこと以外、実施例[思考支援システム(1)]とほぼ同様である。
[Thinking support system (2)]
Next, a thinking support system according to the present embodiment will be described with reference to FIG. In the embodiment [thinking support system (1)], the thinking target text could be input in the form of a sentence as shown in FIG. However, a user who is not accustomed to using the thinking support system may be able to freely input the thinking target text, which may make it difficult to create the thinking target text. As a method of solving the problem, for example, by providing an input screen as shown in FIG. 6 to the thinking support system, preprocessing of input text is simplified, and the user is not used to using the thinking support system. It is also possible to make it easier for the user to create a thought target text. It is almost the same as the embodiment [thinking support system (1)] except that the preprocessing of the input text is simplified.

[実施の形態の拡張]
以上、さまざまな実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。
[Expansion of Embodiment]
As described above, the present invention has been described with reference to various embodiments, but the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

10…思考支援システム
11…操作入力部
12…画面表示部
13…通信I/F部
14…記憶部
15…演算処理部
16…データベース部
10 thinking support system 11 operation input unit 12 screen display unit 13 communication I / F unit 14 storage unit 15 arithmetic processing unit 16 database unit

Claims (7)

思考の対象となるテキストを入力テキストとして取得する入力処理手段と、
語句間のつながりに関する情報を記憶する第1の情報記憶手段と、
前記第1の情報記憶手段に記憶される情報を用いて、前記入力テキストに含まれるヲ格の近傍に位置する語句の組であるヲ格近傍語句組を関連性の高い語句の組である関連ヲ格近傍語句組に変換し、前記入力テキストおよび変換された前記関連ヲ格近傍語句組の情報も用いて前記ヲ格を関連性の高い語句である関連ヲ格に変換する関連語句組変換処理手段と、
前記関連語句組変換処理手段により変換された語句の組を出力する出力処理手段と、
を備えることを特徴とする思考支援システム。
Input processing means for acquiring text to be thought as input text;
First information storage means for storing information relating to a connection between phrases;
Using the information stored in the first information storage means, a set of phrases near the case, which is located near the case, included in the input text is a set of phrases having a high relevance. A related phrase set conversion process that converts the case into a related case that is a highly relevant phrase using the input text and the converted information on the related case nearby phrase set. Means,
Output processing means for outputting a set of phrases converted by the related phrase set conversion processing means,
A thinking support system comprising:
前記第1の情報記憶手段は語句間のつながりに関する分散表現形式の情報を含み、前記関連語句組変換処理手段は前記分散表現形式の情報を元にもつ空間における平行移動性に関する指標も用いることにより、前記入力テキストに含まれるヲ格の近傍に位置する語句の組であるヲ格近傍語句組を関連性の高い語句の組である関連ヲ格近傍語句組に変換することを特徴とする
請求項1に記載の思考支援システム。
The first information storage means includes information in a distributed expression form relating to a connection between words and phrases, and the related word / phrase set conversion processing means uses an index relating to parallel movement in a space based on the information in the distributed expression form. And converting a set of phrases near the case included in the input text, which is a set of phrases located in the vicinity of the case, into a set of words related to the case near the case, which is a set of highly relevant phrases. 2. The thinking support system according to 1.
思考の対象となるテキストを入力テキストとして取得する入力処理手段と、
ヲ格の近傍に位置する語句であるヲ格近傍語句と名詞句とのつながりに関する情報を含む語句間のつながりに関する情報を記憶する第2の情報記憶手段と、
前記第2の情報記憶手段に記憶される情報を用いて、前記入力テキスト内のヲ格に含まれる名詞句と該ヲ格の近傍に位置するヲ格近傍語句との共起性に関する指標も用いることにより、前記入力テキストに含まれる前記ヲ格の近傍に位置する語句の組であるヲ格近傍語句組を関連性の高い語句の組である関連ヲ格近傍語句組に変換する関連語句組変換処理手段と、
前記関連語句組変換処理手段により変換された語句組を出力する出力処理手段と、
を備えることを特徴とする思考支援システム。
Input processing means for acquiring text to be thought as input text;
A second information storage unit that stores information on a connection between phrases including information on a connection between a ヲ case neighboring phrase and a noun phrase, which is a phrase located near the ヲ case,
Using the information stored in the second information storage means, an index relating to the cooccurrence of a noun phrase included in the case in the input text and a word near the case close to the case is also used. Thereby, a related phrase set conversion for converting a set of phrases close to the case included in the input text, which is a set of phrases located in the vicinity of the case, into a set of related relevant words near the case, which is a set of highly relevant phrases. Processing means;
Output processing means for outputting the phrase set converted by the related phrase set conversion processing means,
A thinking support system comprising:
前記第1の情報記憶手段はヲ格の近傍に位置する語句であるヲ格近傍語句と名詞句とのつながりに関する情報を含み、前記関連語句組変換処理手段は前記入力テキスト内のヲ格に含まれる名詞句と該ヲ格の近傍に位置する語句との共起性に関する指標も用いることにより、前記入力テキストに含まれるヲ格の近傍に位置する語句の組であるヲ格近傍語句組を関連性の高い語句の組である関連ヲ格近傍語句組に変換することを特徴とする
請求項2に記載の思考支援システム。
The first information storage means includes information on a connection between a noun phrase and a noun phrase near the noun phrase, which is a phrase located in the vicinity of the noun, and the related phrase set conversion processing means includes the information in the noun case in the input text. By using an index related to co-occurrence between a noun phrase and a phrase located in the vicinity of the case, the pair of phrases located in the vicinity of the case included in the input text can be related. The thinking support system according to claim 2, wherein the thought support system converts the phrase into a related ヲ case neighborhood phrase group that is a group of highly likely phrases.
コンピュータを、請求項1〜4のいずれか1つに記載の思考支援システムを構成する各手段として機能させるための思考支援プログラム。 A thinking support program for causing a computer to function as each unit constituting the thinking support system according to claim 1. 請求項5に記載の思考支援プログラムを記憶したコンピュータ読み込み可能な思考支援プログラム記録媒体。 A computer-readable thinking support program recording medium storing the thinking support program according to claim 5. 請求項3もしくは4のいずれか1つに記載の第1もしくは第2の情報記憶手段に記憶される情報のうち、少なくともヲ格に含まれる名詞句とその近傍に位置する語句とのつながりに関する情報を記憶したコンピュータ読み込み可能な思考支援情報記録媒体。 5. Information relating to a connection between a noun phrase included in at least a ヲ case and a phrase located in the vicinity thereof, among the information stored in the first or second information storage means according to claim 3. Computer-readable thinking support information recording medium that stores the information.
JP2018158543A 2018-08-27 2018-08-27 Thinking support system, thinking support program, thinking support program storage medium, and thinking support information recording medium Active JP6501439B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018158543A JP6501439B1 (en) 2018-08-27 2018-08-27 Thinking support system, thinking support program, thinking support program storage medium, and thinking support information recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018158543A JP6501439B1 (en) 2018-08-27 2018-08-27 Thinking support system, thinking support program, thinking support program storage medium, and thinking support information recording medium

Publications (2)

Publication Number Publication Date
JP6501439B1 JP6501439B1 (en) 2019-04-17
JP2020035010A true JP2020035010A (en) 2020-03-05

Family

ID=66166648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018158543A Active JP6501439B1 (en) 2018-08-27 2018-08-27 Thinking support system, thinking support program, thinking support program storage medium, and thinking support information recording medium

Country Status (1)

Country Link
JP (1) JP6501439B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185636A (en) * 2011-03-04 2012-09-27 Nippon Hoso Kyokai <Nhk> Document simplification device and program
JP2016021218A (en) * 2014-12-08 2016-02-04 株式会社think−plus Thinking supporting dictionary, thinking supporting dictionary system, thinking supporting system, thinking supporting method, thinking supporting program, thinking supporting program storage medium and thinking supporting data storage medium
JP2017041112A (en) * 2015-08-20 2017-02-23 ヤフー株式会社 Information providing device, information providing method, and information providing program
JP2017173866A (en) * 2016-03-18 2017-09-28 ヤフー株式会社 Extraction device and extraction method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012185636A (en) * 2011-03-04 2012-09-27 Nippon Hoso Kyokai <Nhk> Document simplification device and program
JP2016021218A (en) * 2014-12-08 2016-02-04 株式会社think−plus Thinking supporting dictionary, thinking supporting dictionary system, thinking supporting system, thinking supporting method, thinking supporting program, thinking supporting program storage medium and thinking supporting data storage medium
JP2017041112A (en) * 2015-08-20 2017-02-23 ヤフー株式会社 Information providing device, information providing method, and information providing program
JP2017173866A (en) * 2016-03-18 2017-09-28 ヤフー株式会社 Extraction device and extraction method

Also Published As

Publication number Publication date
JP6501439B1 (en) 2019-04-17

Similar Documents

Publication Publication Date Title
Da The computational case against computational literary studies
US10698977B1 (en) System and methods for processing fuzzy expressions in search engines and for information extraction
Joseph et al. Natural language processing: A review
US20170300565A1 (en) System and method for entity extraction from semi-structured text documents
Shakir et al. A multidimensional analysis of Pakistani and US English blogs and columns
Zope et al. Question answer system: A state-of-art representation of quantitative and qualitative analysis
Chernova Occupational skills extraction with FinBERT
Gao et al. A review of natural language processing for financial technology
Majdik et al. Building better machine learning models for rhetorical analyses: the use of rhetorical feature sets for training artificial neural network models
Kondurkar et al. Modern applications with a focus on training chatgpt and gpt models: Exploring generative ai and nlp
Begum et al. Analysis of legal case document automated summarizer
Yamamoto et al. Proposal of japanese vocabulary difficulty level dictionaries for automated essay scoring support system using rubric
Putri et al. Software feature extraction using infrequent feature extraction
Gammack et al. Semantic knowledge management system for design documentation with heterogeneous data using machine learning
Vukanti et al. Business Analytics: A case-study approach using LDA topic modelling
Mahmood et al. KEFST: A knowledge extraction framework using finite-state transducers
Mischke et al. Digital Melville and Computational Methods in Literary Studies
JP6501439B1 (en) Thinking support system, thinking support program, thinking support program storage medium, and thinking support information recording medium
Ali et al. Word embedding based new corpus for low-resourced language: Sindhi
Fritzner Automated information extraction in natural language
Ivanovs et al. Service-oriented architecture of intelligent environment for historical records studies
Das Dawn et al. A dataset for evaluating Bengali word sense disambiguation techniques
Woldeyohannis et al. Usable Amharic text corpus for natural language processing applications
Zamin Information Extraction using Link Grammar
CN112949287B (en) Hot word mining method, system, computer equipment and storage medium

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180903

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180903

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6501439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150