JP6707484B2 - Understanding support method, understanding support device and program - Google Patents

Understanding support method, understanding support device and program Download PDF

Info

Publication number
JP6707484B2
JP6707484B2 JP2017048540A JP2017048540A JP6707484B2 JP 6707484 B2 JP6707484 B2 JP 6707484B2 JP 2017048540 A JP2017048540 A JP 2017048540A JP 2017048540 A JP2017048540 A JP 2017048540A JP 6707484 B2 JP6707484 B2 JP 6707484B2
Authority
JP
Japan
Prior art keywords
group
importance
unit
component
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017048540A
Other languages
Japanese (ja)
Other versions
JP2018151939A (en
Inventor
理香 望月
理香 望月
渡辺 昌洋
昌洋 渡辺
清志 中濱
清志 中濱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017048540A priority Critical patent/JP6707484B2/en
Publication of JP2018151939A publication Critical patent/JP2018151939A/en
Application granted granted Critical
Publication of JP6707484B2 publication Critical patent/JP6707484B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、理解支援方法、理解支援装置及びプログラムに関する。 The present invention relates to an understanding support method, an understanding support device, and a program.

近年、訪日外国人の増加に伴い、観光客向けにわかりやすい情報提供が必要となる機会は多い。また、我々日本人が海外に行った際にも、初めて見る食べ物などなじみのない事物について説明が必要となる機会は多い。なじみのない事物について理解する方法として、ガイドブックの説明を調べたり、Web検索でキーワードを入力して検索結果から辞書などの説明を閲覧したりすることは多い。 In recent years, with the increase in the number of foreigners visiting Japan, there are many opportunities to provide easy-to-understand information to tourists. Also, when we Japanese go abroad, there are many occasions where we need to explain things that we are not familiar with, such as food that we see for the first time. As a method for understanding unfamiliar things, it is often the case to look up the explanation in a guidebook or to enter a keyword in a Web search and browse the explanation such as a dictionary from the search results.

それらの方法では、利用者は自力で検索結果を俯瞰して理解する必要があるため煩雑である。 These methods are complicated because the user needs to look down and understand the search results by himself.

また、なじみのない事物の理解を支援する方法として、これまでに、Webページの検索結果の提示順を工夫することで理解を促進する方法が提案されている。 Further, as a method for supporting understanding of unfamiliar things, a method of promoting understanding by devising a presentation order of search results of Web pages has been proposed so far.

西原陽子,砂山渡,谷内田正彦,"Webページの難易度と学習順序に基づく情報理解支援システム", 電子情報通信学会論文誌D, Vol.J89-D, No.9, pp.1963-1975, 2006.Yoko Nishihara, Wataru Sunayama, Masahiko Yachida, "Information Understanding Support System based on Web Page Difficulty and Learning Order", IEICE Transactions D, Vol.J89-D, No.9, pp.1963-1975, 2006.

非特許文献1の方式では、Web検索結果を難易度に基づいて順序立てて提示することで、簡単な内容から順を追ってなじみのない単語の理解を促進するシステムを提案している。入力されるキーワードが専門用語などの難しい言葉であれば、検索結果を難易度に基づいて比較できるが、食べ物の名前などが入力された場合、検索結果に含まれるキーワードは原材料や産地、味などであり、説明に難易度の差が無いため難易度で説明の順序を決めることができない。また、旅行先などで目の前にある食べ物などについてすぐ知りたい場合、じっくり検索結果を読み込むことは煩雑である。 The method of Non-Patent Document 1 proposes a system that promotes understanding of unfamiliar words in order from simple content by presenting Web search results in order based on difficulty level. If the entered keyword is a difficult word such as a technical term, the search results can be compared based on the degree of difficulty, but if the name of food is entered, the keyword included in the search result will be the raw material, the place of origin, the taste, etc. Since there is no difference in difficulty in explanation, the order of explanation cannot be determined by difficulty. In addition, if you want to immediately know about food in front of you when traveling, it is complicated to read the search results carefully.

また、関連サービスとして、飲食店サイトに掲載されたメニューの補足説明を外国人向けに提示するサービス「ぐるなび外国語版」が挙げられる。このサービスでは、提示する補足説明は事前に飲食店(サービス提供者)側が選択及び入力する必要があり、説明を自動生成することはできないため、手間がかかる。また、複数の食材が含まれる場合に個々の食材の説明まで対応することはできない。 Also, as a related service, there is a service "GourNavi foreign language version" that presents supplementary explanations of menus posted on restaurant sites to foreigners. In this service, the supplementary explanation to be presented needs to be selected and input by the restaurant (service provider) side in advance, and the explanation cannot be automatically generated, which is troublesome. Further, when a plurality of ingredients are included, it is not possible to deal with the explanation of each ingredient.

本発明は、上記の点に鑑みてなされたものであって、事物の効率的な理解を支援することを目的とする。 The present invention has been made in view of the above points, and an object thereof is to support efficient understanding of things.

そこで上記課題を解決するため、或る事物に関する文書情報を取得する取得手順と、前記文書情報の構成要素を抽出する抽出手順と、事物の説明に用いられる複数の用語を該説明における役割の観点から複数のグループに分類して記憶する記憶部を参照して、前記各構成要素が属するグループを判定する判定手順と、優先順位の高いグループから順に、各グループでの最大提示数の規定のもと、合計で決められた最大数以下の構成要素を出力対象として選択する選択手順と、をコンピュータが実行する。

Therefore, in order to solve the above-mentioned problems, an acquisition procedure for acquiring document information about a certain thing, an extraction procedure for extracting the constituent elements of the document information, and a plurality of terms used for explaining the thing are described in terms of roles in the description. From the storage unit that classifies and stores the plurality of groups, the determination procedure for determining the group to which each of the constituent elements belongs , and the maximum presentation number in each group in order from the group with the highest priority. And a selection procedure for selecting, as an output target, a component number equal to or less than the maximum number determined in total .

事物の効率的な理解を支援することができる。 It can support efficient understanding of things.

本発明の実施の形態におけるシステムの構成例を示す図である。It is a figure showing an example of composition of a system in an embodiment of the invention. 本発明の実施の形態における理解支援装置10のハードウェア構成例を示す図である。It is a figure showing an example of hardware constitutions of understanding support device 10 in an embodiment of the invention. 本発明の実施の形態における理解支援装置10の機能構成例を示す図である。It is a figure showing an example of functional composition of understanding support device 10 in an embodiment of the invention. 理解支援装置10が実行する処理手順の一例を説明するためのフローチャートである。6 is a flowchart for explaining an example of a processing procedure executed by the understanding support device 10. 構成要素及び要素重要度の抽出結果の一例を示す図である。It is a figure which shows an example of the extraction result of a component and element importance. 構造化ルール定義DB120の構成例を示す図である。It is a figure which shows the structural example of structured rule definition DB120. 各構成要素に構造タグが付与された例を示す図である。It is a figure which shows the example in which the structure tag was attached to each component. 提示ルール定義DB130の構成例を示す図である。It is a figure which shows the structural example of presentation rule definition DB130. 提示情報の一例を示す図である。It is a figure which shows an example of presentation information.

以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態におけるシステムの構成例を示す図である。図1において、理解支援装置10は、1以上の利用者端末20とインターネット等のネットワークN1を介して接続される。利用者端末20は、無線回線等を経由して、ネットワークN1に接続されてもよい。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration example of a system according to an embodiment of the present invention. In FIG. 1, the understanding support device 10 is connected to one or more user terminals 20 via a network N1 such as the Internet. The user terminal 20 may be connected to the network N1 via a wireless line or the like.

理解支援装置10は、ユーザにとってなじみのない任意の事物(商品名等の固有名詞、"うどん"のような一般名詞、"ぶりの照り焼き"のようなメニュー名、ランドマーク名や地名など)(以下、「対象事物」という。)の理解を支援するためにユーザに対して提示する情報(以下、「提示情報」という。)を生成及び出力する1以上のコンピュータである。 The understanding support device 10 is an arbitrary thing that the user is not familiar with (proprietary nouns such as product names, general nouns such as "udon", menu names such as "teriyaki teriyaki", landmark names and place names). One or more computers that generate and output information (hereinafter referred to as “presentation information”) to be presented to the user in order to assist understanding of (hereinafter referred to as “target object”).

利用者端末20は、ユーザが所有するスマートフォン、タブレット、PC、店頭や駅などの公共の場に設置された端末など、対象事物を示す情報(以下、「対象情報」という。)を入力できる任意の機器である。対象情報の一例として、対象事物の名称や対象事物を表す用語等が挙げられる。対象情報の入力方法は、音声入力、タッチパネルによる選択、文字入力、又はキーボード入力等、任意の方法でよい。 The user terminal 20 is capable of inputting information (hereinafter, referred to as “target information”) indicating a target object such as a smartphone, a tablet, a PC owned by a user, a terminal installed in a public place such as a store or a station. Equipment. As an example of the target information, there are a name of the target object, a term representing the target object, and the like. The input method of the target information may be any method such as voice input, touch panel selection, character input, or keyboard input.

図2は、本発明の実施の形態における理解支援装置10のハードウェア構成例を示す図である。図2の理解支援装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。 FIG. 2 is a diagram showing a hardware configuration example of the understanding support device 10 in the embodiment of the present invention. The understanding support device 10 of FIG. 2 includes a drive device 100, an auxiliary storage device 102, a memory device 103, a CPU 104, an interface device 105, and the like, which are connected to each other by a bus B.

理解支援装置10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。 A program that realizes the processing in the understanding support device 10 is provided by a recording medium 101 such as a CD-ROM. When the recording medium 101 storing the program is set in the drive device 100, the program is installed from the recording medium 101 to the auxiliary storage device 102 via the drive device 100. However, it is not always necessary to install the program from the recording medium 101, and the program may be downloaded from another computer via the network. The auxiliary storage device 102 stores the installed program and also stores necessary files and data.

メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って理解支援装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。 The memory device 103 reads the program from the auxiliary storage device 102 and stores the program when an instruction to activate the program is given. The CPU 104 executes a function related to the understanding support device 10 according to a program stored in the memory device 103. The interface device 105 is used as an interface for connecting to a network.

図3は、本発明の実施の形態における理解支援装置10の機能構成例を示す図である。図3において、理解支援装置10は、受信部11、条件抽出部12、要素抽出部13、構成情報取得部14、提示ルール取得部15、表示整形部16及び送信部17等を有する。これら各部は、理解支援装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。理解支援装置10は、また、構造化ルール定義DB120及び提示ルール定義DB130等のデータベース(記憶部)を利用する。これら各データベースは、例えば、補助記憶装置102、又は理解支援装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。 FIG. 3 is a diagram showing a functional configuration example of the understanding support device 10 in the embodiment of the present invention. 3, the understanding support device 10 includes a receiving unit 11, a condition extracting unit 12, an element extracting unit 13, a configuration information acquiring unit 14, a presentation rule acquiring unit 15, a display shaping unit 16, a transmitting unit 17, and the like. Each of these units is realized by a process that causes the CPU 104 to execute one or more programs installed in the understanding support device 10. The understanding support device 10 also uses databases (storage units) such as the structured rule definition DB 120 and the presentation rule definition DB 130. Each of these databases can be realized using, for example, the auxiliary storage device 102 or a storage device that can be connected to the understanding support device 10 via a network.

以下、理解支援装置10が実行する処理手順について説明する。図4は、理解支援装置10が実行する処理手順の一例を説明するためのフローチャートである。 The processing procedure executed by the understanding support device 10 will be described below. FIG. 4 is a flowchart for explaining an example of a processing procedure executed by the understanding support device 10.

ステップS1において、受信部11は、利用者端末20に対して入力された対象情報に係る対象事物の提示情報の取得要求を、利用者端末20から受信する。当該取得要求には、対象情報が含まれる。 In step S<b>1, the receiving unit 11 receives, from the user terminal 20, the acquisition request for the presentation information of the target object related to the target information input to the user terminal 20. The acquisition request includes the target information.

続いて、条件抽出部12は、提示環境情報を取得し、当該提示環境情報を受信部11へ送信する(S2)。提示環境情報とは、例えば、「スマートフォン」、「PC」、「タブレット」、「スマートTV」等、提示情報の出力先の環境(利用者端末20)の種別を示すである。本実施の形態では、対象情報の入力元と提示情報の出力先とが同じ利用者端末20である例について説明するが、当該入力元及び当該出力先が異なる場合には、出力先の利用者端末20の提示環境情報が取得されればよい。なお、提示環境情報は、利用者端末20から送信される、提示情報の取得要求に含まれる情報に基づいて条件抽出部12が自動的に判別してもよいし、利用者端末20に対してユーザによって明示的に入力されてもよい。提示環境情報が、自動的に判別される場合に、提示環境情報が判別できない場合は、予め設定されるデフォルト値(例えば、「スマートフォン」等)が提示環境情報として採用されてもよい。 Subsequently, the condition extraction unit 12 acquires the presentation environment information and transmits the presentation environment information to the reception unit 11 (S2). The presentation environment information indicates the type of environment (user terminal 20) to which the presentation information is output, such as “smartphone”, “PC”, “tablet”, “smart TV”, or the like. In the present embodiment, an example will be described in which the input source of the target information and the output destination of the presentation information are the same user terminal 20, but when the input source and the output destination are different, the user of the output destination The presentation environment information of the terminal 20 may be acquired. The presentation environment information may be automatically discriminated by the condition extraction unit 12 based on the information included in the presentation information acquisition request transmitted from the user terminal 20. It may be explicitly input by the user. When the presentation environment information is automatically discriminated, if the presentation environment information cannot be discriminated, a preset default value (for example, “smartphone” or the like) may be adopted as the presentation environment information.

続いて、受信部11は、受信した対象情報を要素抽出部13へ送信し(S3)、提示環境情報を提示ルール取得部15へ送信する(S4)。 Subsequently, the reception unit 11 transmits the received target information to the element extraction unit 13 (S3) and the presentation environment information to the presentation rule acquisition unit 15 (S4).

続いて、要素抽出部13は、対象情報に対する提示情報の情報源D1を収集する(S5)。情報源D1は、例えば、対象情報を検索語としてWeb(インターネット)で検索することで得られるスニペットの上位100件等でもよい。すなわち、情報源D1は、対象事物に関する何らかの情報(対象事物を説明する情報又は対象事物の特徴を表す情報等)が記載された文書情報群である。 Subsequently, the element extraction unit 13 collects the information source D1 of the presentation information for the target information (S5). The information source D1 may be, for example, the top 100 snippets obtained by searching the target information as a search word on the Web (Internet). That is, the information source D1 is a document information group in which some kind of information related to the target object (information describing the target object or information indicating the characteristics of the target object) is described.

続いて、要素抽出部13は、情報源D1の構成要素と、各構成要素の要素重要度とを情報源D1から抽出する(S6)。構成要素は、例えば、単語等であり、要素重要度は、単語重要度である。構成要素は、情報源D1を形態素解析することによって取得されてもよい。形態素解析には、例えば、「http://tools.metro-bb.com/api/keitaiso」において公開されているツールが利用されてもよい。なお、スニペット100件等、複数の文書情報が情報源D1である場合、要素抽出部13は、収集した全ての文書情報群を一つにまとめた文書情報に対して形態素解析を行うことで、構成要素群(単語群)を得る。構成要素の要素重要度(単語重要度)は、形態素解析によって得られる出現頻度等、対象事物の特徴の表現における重要性の程度を示すことが可能な数値であればよい。 Subsequently, the element extracting unit 13 extracts the constituent element of the information source D1 and the element importance degree of each constituent element from the information source D1 (S6). The component is, for example, a word, and the element importance is the word importance. The components may be obtained by morphologically analyzing the information source D1. For the morphological analysis, for example, a tool disclosed in “http://tools.metro-bb.com/api/keitaiso” may be used. When a plurality of pieces of document information, such as 100 snippets, is the information source D1, the element extraction unit 13 performs a morpheme analysis on the document information in which all the collected pieces of document information are combined into one. Get the component group (word group). The element importance degree (word importance degree) of the constituent element may be any numerical value capable of indicating the degree of importance in the expression of the feature of the target object such as the appearance frequency obtained by the morpheme analysis.

図5は、構成要素及び要素重要度の抽出結果の一例を示す図である。図5では、対象情報が「なめろう」である場合の情報源D1と、情報源D1から抽出された構成要素及び要素重要度が示されている。 FIG. 5 is a diagram showing an example of the extraction result of the constituent elements and the element importance degree. In FIG. 5, the information source D1 in the case where the target information is “namero”, and the constituent elements and element importance levels extracted from the information source D1 are shown.

続いて、要素抽出部13は、各構成要素と各構成要素の要素重要度とを構成情報取得部14へ送信する(S7)。 Subsequently, the element extraction unit 13 transmits each component and the element importance of each component to the configuration information acquisition unit 14 (S7).

続いて、構成情報取得部14は、構造化ルール定義DB120を参照して、各構成要素について、提示情報に含める構成要素を選択する際の優先順位を判定する(S8)。 Subsequently, the configuration information acquisition unit 14 refers to the structured rule definition DB 120, and determines the priority order for selecting the configuration element to be included in the presentation information for each configuration element (S8).

図6は、構造化ルール定義DB120の構成例を示す図である。図6に示されるように、構造化ルール定義DB120には、予め、複数の登録キーワードが1以上の構造定義に分類されて登録されている。構造定義は、各種の事物の説明に用いられる複数の用語をその説明における役割の観点から複数のグループに分類する概念である。登録キーワードは、事物の説明に用いられる用語である。 FIG. 6 is a diagram showing a configuration example of the structured rule definition DB 120. As shown in FIG. 6, in the structured rule definition DB 120, a plurality of registered keywords are registered in advance by being classified into one or more structure definitions. The structural definition is a concept that classifies a plurality of terms used to describe various things into a plurality of groups in terms of their roles in the description. The registered keyword is a term used to describe things.

各構造定義には、登録キーワードを提示情報として提示する際の優先順位である提示重要度が設定されている。本実施の形態では、提示重要度の値が大きい程、優先順位が高い。複数の構造定義に対して同じ提示重要度が設定されてもよい。提示重要度は、構造定義間の相対的な優先度を比較可能な値であればどのような値でもよく、例えば、少数等の細かな数値で定義されてもよい。 In each structure definition, a presentation importance, which is a priority when presenting registered keywords as presentation information, is set. In the present embodiment, the larger the value of the presentation importance, the higher the priority. The same presentation importance level may be set for a plurality of structure definitions. The presentation importance may be any value as long as the relative priorities between the structure definitions can be compared, and may be defined by a fine numerical value such as a small number.

図6では、「カテゴリー」、「構成(材料)」、「構成(作り方)」、「評価」、「位置付け」及び「特殊要素」の6つの構造定義が登録された例が示されているが、構造定義の分類形態や、構造定義の数は、所定のものに限られない。 Although FIG. 6 shows an example in which six structural definitions of “category”, “composition (material)”, “composition (making method)”, “evaluation”, “positioning” and “special element” are registered. The classification form of structure definitions and the number of structure definitions are not limited to predetermined ones.

「カテゴリー」は、事物のカテゴリー、すなわち、事物が何であるかを、対象情報として用いられる用語以外で表現する用語が属する分類(グループ)である。食べ物であれば、料理、食品、嗜好品類などが「カテゴリー」の一部として考えられ、建造物であれば、寺院、ビルなどが「カテゴリー」の一部として考えられる。 The “category” is a category (group) to which a term expressing a category of a thing, that is, what the thing is other than a term used as target information belongs. In the case of food, dishes, foods, luxury items, etc. are considered as part of the "category", and in the case of buildings, temples, buildings, etc. are considered as part of the "category".

「構成」は、事物そのものに関する客観的な説明に用いられる用語が属する分類(グループ)である。食べ物の場合は、食材や調味料などの材料、調理法や切り方といった作り方などが「構成」の一部として考えられ、建造物の場合は、大きさや色などの外観、時代や関連人物といった歴史などが「構成」の一部として考えられる。 “Structure” is a classification (group) to which the terms used for objectively explaining the thing itself belong. In the case of food, ingredients such as ingredients and seasonings, and recipes such as cooking methods and cutting methods are considered as part of the composition, and in the case of buildings, appearance such as size and color, period and related people are considered. History can be considered as a part of "composition".

「評価」は、事物に対する人の感想等を表現する際に用いられる用語が属する分類(グループ)である。「位置付け」は、事物が社会的にどのように捉えられているか(事物の社会的な位置付け)を表現する用語が属する分類(グループ)である。「特殊要素」については後述される。 “Evaluation” is a classification (group) to which a term used when expressing a person's impression of a thing belongs. "Positioning" is a classification (group) to which terms expressing how things are perceived in society (social positioning of things) belong. The “special element” will be described later.

登録キーワードの登録は、例えば、日本語語彙大系(http://www.kecl.ntt.co.jp/icl/lirg/resources/GoiTaikei/)などの単語の分類定義が参照されて行われてもよい。日本語語彙大系では、任意の単語の分類が定義されている。この分類に該当する用語が登録キーワードとして登録されてもよい。各用語がいずれの構造定義に属するかは、登録者によって判断されてもよい。また、日本語語彙大系に存在しない用語が、登録キーワードに追加されてもよい。 Registration of registered keywords is performed by referring to the classification definitions of words such as Japanese Vocabulary (http://www.kecl.ntt.co.jp/icl/lirg/resources/GoiTaikei/). Good. In the Japanese vocabulary system, an arbitrary word classification is defined. A term corresponding to this classification may be registered as a registered keyword. Which structural definition each term belongs to may be determined by the registrant. Moreover, a term that does not exist in the Japanese vocabulary system may be added to the registered keywords.

なお、構造定義としてどのようなグループ分けをするかや、提示重要度等は、ユーザ調査や評価などに基づいて決定してもよい。図6の例は、実際にユーザ調査の知見に基づいて定めた提示重要度と構造定義である。また、構造化ルール定義DB120は、食べ物、建造物、それ以外など事物の種別に応じて複数用意されてもよい。 It should be noted that what kind of grouping is to be performed as the structure definition, the degree of presentation importance, etc. may be determined based on a user survey or evaluation. The example of FIG. 6 is the presentation importance level and the structure definition that are actually determined based on the knowledge of the user survey. Further, a plurality of structured rule definition DBs 120 may be prepared according to the types of things such as food, buildings, and others.

ステップS8において、構成情報取得部14は、情報源D1から得られた各構成要素について、構造化ルール定義DB120を参照して、構造定義及び提示重要度を特定する。すなわち、構成情報取得部14は、当該各構成要素をいずれかの構造定義に分類し、分類先の構造定義に対応する提示重要度を各構成要素について特定する。 In step S8, the configuration information acquisition unit 14 specifies the structure definition and the presentation importance degree with reference to the structured rule definition DB 120 for each component obtained from the information source D1. That is, the configuration information acquisition unit 14 classifies each of the constituent elements into any of the structure definitions, and specifies the presentation importance degree corresponding to the structure definition of the classification destination for each of the constituent elements.

具体的には、構成情報取得部14は、いずれかの登録キーワードに完全一致する構成要素については、当該登録キーワードに対応する構造定義及び提示重要度を取得する。構成情報取得部14は、いずれの登録キーワードにも完全一致しない構成要素については、当該構成要素の分類に一致する登録キーワードに対応する構造定義及び提示重要度を取得する。当該構成要素の分類の特定には、日本語語彙大系が用いられてもよい。例えば、「郷土料理」という構成要素について、日本語語彙大系で「料理」という分類が特定された場合、構成情報取得部14は、登録キーワード「料理」に対応する構造定義及び提示重要度を取得する。構成情報取得部14は、各構成要素について特定された構造定義を構造タグとして当該構成要素に付与する。なお、日本語語彙大系で得られた分類がいずれの登録キーワードにも一致しない構成要素については、構成情報取得部14は、当該分類の名称(分類名)をそのまま構造タグとして当該構成要素に付与する。各構成要素に構造タグが付与された例を図7に示す。 Specifically, the configuration information acquisition unit 14 acquires the structure definition and the presentation importance degree corresponding to the registered keyword for the component that completely matches any of the registered keywords. The configuration information acquisition unit 14 acquires the structure definition and the presentation importance degree corresponding to the registered keyword that matches the classification of the component, for the component that does not completely match any of the registered keywords. A Japanese vocabulary system may be used to specify the classification of the component. For example, when the classification of “cooking” is specified in the Japanese vocabulary for the constituent element “local cuisine”, the configuration information acquisition unit 14 determines the structure definition and the presentation importance degree corresponding to the registered keyword “cooking”. get. The configuration information acquisition unit 14 adds the structure definition specified for each component to the component as a structure tag. In addition, for a component whose classification obtained in the Japanese vocabulary system does not match any of the registered keywords, the configuration information acquisition unit 14 uses the name of the classification (classification name) as a structure tag as the structural element. Give. FIG. 7 shows an example in which a structural tag is added to each component.

なお、或る構成要素が固有名詞等のように日本語語彙大系に含まれない単語等であり、当該構成要素の要素重要度が閾値より高い場合には、構成情報取得部14は、当該構成要素を、構造化ルール定義DB120の「特殊要素」の登録キーワードに登録してもよい。この場合、当該構成要素に付与される構造タグは、「特殊要素」となる。また、当該閾値は、例えば、各構成要素の要素重要度の平均値であってもよい。なお、「特殊要素」という構造定義が構造化ルール定義DB120に存在しない場合には、「特殊要素」という構造定義が構造化ルール定義DB120に追加された上で、当該構造定義の登録キーワードに当該構成要素が追加されればよい。この際、当該構造定義の提示重要度は、既存の構造定義のいずれの提示重要度よりも低い値とされればよい。 If a certain component is a word such as a proper noun that is not included in the Japanese vocabulary, and the component importance of the component is higher than the threshold, the configuration information acquisition unit 14 The constituent element may be registered in the registration keyword of the “special element” in the structured rule definition DB 120. In this case, the structure tag given to the component is a "special element". Further, the threshold may be, for example, an average value of the element importance degrees of the respective constituent elements. When the structure definition “special element” does not exist in the structured rule definition DB 120, the structure definition “special element” is added to the structured rule definition DB 120 and then the registered keyword of the structure definition is added. It suffices if components are added. At this time, the presentation importance of the structure definition may be set to a value lower than any presentation importance of the existing structure definitions.

続いて、構成情報取得部14は、全ての構成要素と、各構成要素の要素重要度、構造タグ及び提示重要度を表示整形部16へ送信する(S9)。 Subsequently, the configuration information acquisition unit 14 transmits all the components and the element importance, the structure tag, and the presentation importance of each component to the display shaping unit 16 (S9).

続いて、提示ルール取得部15は、ステップS4において受信部11から送信された提示環境情報に対応する提示ルールを提示ルール定義DB130から取得し、当該提示ルールを表示整形部16へ送信する(S10)。 Subsequently, the presentation rule acquisition unit 15 acquires the presentation rule corresponding to the presentation environment information transmitted from the reception unit 11 in step S4 from the presentation rule definition DB 130 and transmits the presentation rule to the display shaping unit 16 (S10). ).

図8は、提示ルール定義DB130の構成例を示す図である。図8に示されるように、提示ルール定義DB130には、提示情報の出力先の候補となる提示環境ごとに、提示ルールが登録されている。 FIG. 8 is a diagram showing a configuration example of the presentation rule definition DB 130. As shown in FIG. 8, a presentation rule is registered in the presentation rule definition DB 130 for each presentation environment that is a candidate output destination of presentation information.

提示ルールは、提示情報に含める情報量(構成要素の数等)を提示環境に応じて規定する情報である。例えば、提示ルールは、構造定義と要素重要度とに基づいて、出力対象(提示情報に含められる対象)を規定する。 The presentation rule is information that defines the amount of information (the number of components, etc.) included in the presentation information according to the presentation environment. For example, the presentation rule defines an output target (target included in the presentation information) based on the structure definition and the element importance.

提示ルールとして、提示重要度が高い構成要素を優先して選択するルールが考えられる。その際に、選択される構成要素の要素重要度が閾値th1以上であれば、当該構成要素と同じ構造定義から複数個の情報を提示する、要素重要度が閾値th2以下の場合は当該構成要素と同じ構造定義について2個以上提示しない、などの条件を加えることも考えられる。閾値th1は、例えば、要素重要度の平均値とされ、閾値th2は、例えば、1とされてもよい。 As a presentation rule, a rule that preferentially selects a component having a high presentation importance can be considered. At that time, if the element importance of the selected component is equal to or more than the threshold value th1, a plurality of pieces of information are presented from the same structural definition as the component, and if the element importance is equal to or less than the threshold value th2, the component element is selected. It is also possible to add conditions such as not presenting two or more of the same structure definition. The threshold th1 may be, for example, the average value of the element importance degrees, and the threshold th2 may be 1, for example.

提示ルール定義DB130の設定方法として、提示する情報の数については、例えば一情報あたり4文字として12pt以上の文字サイズを想定した場合に、平均的なスマートフォンの画面サイズの80%以下に収まる文字の量、などとする方法が考えられる。 As a method of setting the presentation rule definition DB 130, regarding the number of pieces of information to be presented, for example, assuming that a character size of 12 pt or more is set as 4 characters per information, the number of characters that fit within 80% or less of the average smartphone screen size is set. A method such as the amount can be considered.

例えば、提示環境情報が「スマートフォン」である場合、提示ルール取得部15は、提示ルール定義DB130(図8)において「スマートフォン」に対応付けられている、「構造定義がカテゴリーの構成要素を1個提示し、次にそれ以外の構造定義について提示重要度が高い順に、各構造定義の構成要素を要素重要度が高いものから2個ずつ提示し、最大7個の情報を提示する」という提示ルールを取得する。 For example, when the presentation environment information is “smartphone”, the presentation rule acquisition unit 15 associates “smartphone” in the presentation rule definition DB 130 (FIG. 8) with “one structural element whose category is the structure definition”. The presentation rule is to present, and then present the constituent elements of each structure definition in order from the one with the highest element importance in order of the highest presentation importance with respect to the other structure definitions, and present up to seven pieces of information. To get.

このように、提示環境情報は、提示ルールの取得に用いられる。したがって、提示環境情報は、提示ルール定義DB130において「提示環境」として登録される粒度で提示環境を識別可能な情報であればよい。 In this way, the presentation environment information is used to acquire the presentation rule. Therefore, the presentation environment information may be any information that can identify the presentation environment with the granularity registered as “presentation environment” in the presentation rule definition DB 130.

なお、例えば、スマートフォンやPCなどの機種や、利用者端末20に接続されているディスプレイの機種等に基づいて更に細かく提示環境が分類されてもよい。この場合、提示する文字数やフォントサイズに応じてさらに細かく提示ルールを設定することができる。 Note that, for example, the presentation environment may be further finely classified based on the model of the smartphone, the PC, or the like, the model of the display connected to the user terminal 20, or the like. In this case, the presentation rule can be set more finely according to the number of characters to be presented and the font size.

続いて、表示整形部16は、各構成要素の要素重要度、構造タグ及び提示重要度と、提示ルールとに基づいて、全ての構成要素の中から提示情報に含める(出力対象とする)構成要素を選択する(S11)。例えば、図8において「スマートフォン」に対応する提示ルールによれば、まず、構造定義が「カテゴリー」の構成要素の中から要素重要度が最高である構成要素(「郷土料理」)が1つ選択される。次に、提示重要度が高い構造定義から順番に、各構造定義に当てはまる構成要素を要素重要度が高いものから2個ずつ、要素重要度が1以下の場合は1個までという条件で最大7個となるまで選択されるため、「構成(材料)」に属する「味噌、アジ」が選択され、「構成(作り方)」に属する「たたき、おろし」が選択され、「評価」に属する「粘り気」が選択され、「位置付け」に属する「つまみ」が選択される。 Subsequently, the display shaping unit 16 includes (configures as an output target) all the constituent elements in the presentation information based on the element importance degree of each constituent element, the structure tag and the presentation importance degree, and the presentation rule. An element is selected (S11). For example, according to the presentation rule corresponding to “smartphone” in FIG. 8, first, one component having the highest element importance (“local cuisine”) is selected from the components having the structural definition of “category”. To be done. Next, in order from the structure definition with the highest presentation importance, two constituent elements applicable to each structure definition are provided in order from the element with the highest element importance, and up to one if the element importance is 1 or less. Since it is selected until it becomes an individual, "miso, horse mackerel" belonging to "composition (material)" is selected, "tataki, grated" belonging to "composition (how to make)" is selected, and "stickiness" belonging to "evaluation" is selected. Is selected, and a “knob” belonging to “positioning” is selected.

続いて、表示整形部16は、選択された構成要素に基づいて、提示情報を生成する(S12)。提示情報は、選択された構成要素を選択順に列挙したものであってもよいし、構成要素を連結して文章にしたものであってもよい。また、図9に示されるように、構造定義ごとに構成要素が含められてもよい。なお、図9では、「カテゴリー」において選択された構成要素が、「これはXXXです。」の「XXX」に当てはめられる例が示されている。また、「構成(材料)」が「主な材料」に置換され、「構成(作り方)」が「調理法」に置換され、「評価」が「味・食感」に置換されるといったように、各構造定義が、対象事物の種別に適した表現に置換される例が示されている。 Subsequently, the display shaping unit 16 generates the presentation information based on the selected component (S12). The presentation information may be a list of selected components in the order of selection, or may be a sentence formed by connecting the components. Moreover, as shown in FIG. 9, a component may be included for each structure definition. Note that FIG. 9 shows an example in which the constituent element selected in “Category” is applied to “XXX” of “This is XXX”. In addition, “composition (material)” is replaced with “main material”, “composition (how to make)” is replaced with “cooking method”, and “evaluation” is replaced with “taste/texture”. , Each structure definition is replaced with an expression suitable for the type of target object.

続いて、表示整形部16は、提示情報を送信部17に送信する(S13)。送信部17は、当該提示情報を利用者端末20へ送信する(S14)。その結果、利用者端末20において提示情報が表示される。 Subsequently, the display shaping unit 16 transmits the presentation information to the transmission unit 17 (S13). The transmission unit 17 transmits the presentation information to the user terminal 20 (S14). As a result, the presentation information is displayed on the user terminal 20.

上述したように、本実施の形態によれば、対象事物の理解の促進に効果が高い情報(構成要素)が優先的に提示されるため、対象事物について効率的な理解を支援することができる。また、Web情報等から対象事物の特徴を導くため、辞書にない用語を含む説明(提示情報)も生成することができる。更に、提示環境に応じて、提示すべき情報の優先度を決めることで、提示環境に応じて情報量を絞ることができる。 As described above, according to the present embodiment, since information (components) that is highly effective in promoting understanding of the target object is preferentially presented, it is possible to support efficient understanding of the target object. .. Further, since the feature of the target object is derived from the Web information or the like, it is possible to generate a description (presentation information) including a term that is not in the dictionary. Furthermore, by determining the priority of the information to be presented according to the presentation environment, the amount of information can be narrowed down according to the presentation environment.

なお、本実施の形態において、要素抽出部13は、取得部及び抽出部の一例である。構成情報取得部14は、判定部の一例である。表示整形部16は、選択部の一例である。構造化ルールDB120は、記憶部の一例である。 In addition, in this Embodiment, the element extraction part 13 is an example of an acquisition part and an extraction part. The configuration information acquisition unit 14 is an example of a determination unit. The display shaping unit 16 is an example of a selection unit. The structured rule DB 120 is an example of a storage unit.

以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 Although the embodiments of the present invention have been described in detail above, the present invention is not limited to such specific embodiments, and various modifications are possible within the scope of the gist of the present invention described in the claims. It can be modified and changed.

10 理解支援装置
11 受信部
12 条件抽出部
13 要素抽出部
14 構成情報取得部
15 提示ルール取得部
16 表示整形部
17 送信部
20 利用者端末
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
120 構造化ルール定義DB
130 提示ルール定義DB
B バス
D1 情報源
10 understanding support device 11 receiving unit 12 condition extracting unit 13 element extracting unit 14 configuration information acquiring unit 15 presentation rule acquiring unit 16 display shaping unit 17 transmitting unit 20 user terminal 100 drive device 101 recording medium 102 auxiliary storage device 103 memory device 104 CPU
105 Interface device 120 Structured rule definition DB
130 Presentation rule definition DB
B bus D1 information source

Claims (7)

或る事物に関する文書情報を取得する取得手順と、
前記文書情報の構成要素を抽出する抽出手順と、
事物の説明に用いられる複数の用語を該説明における役割の観点から複数のグループに分類して記憶する記憶部を参照して、前記各構成要素が属するグループを判定する判定手順と、
優先順位の高いグループから順に、各グループでの最大提示数の規定のもと、合計で決められた最大数以下の構成要素を出力対象として選択する選択手順と、
をコンピュータが実行することを特徴とする理解支援方法。
An acquisition procedure for acquiring document information about a certain thing,
An extraction procedure for extracting the constituent elements of the document information,
A determination procedure for determining a group to which each of the constituent elements belongs by referring to a storage unit that stores a plurality of terms used to describe an object by classifying them into a plurality of groups from the viewpoint of the role in the description,
In order from the group with the highest priority , under the provision of the maximum number of presentations in each group, a selection procedure for selecting as many output components as the maximum number or less determined in total ,
An understanding support method, characterized in that a computer executes.
前記抽出手順は、複数の前記構成要素のそれぞれの重要度を抽出し、
前記選択手順は、同じグループに属すると判定された複数の前記構成要素について、前記重要度に基づいて出力対象とする構成要素を選択する、
ことを特徴とする請求項1記載の理解支援方法。
The extraction procedure to extract the respective importance of the components of multiple,
The selection procedure for a plurality of said component which are determined to belong to the same group, to select a component to be outputted is based on the importance,
The understanding support method according to claim 1, wherein:
或る事物に関する文書情報を取得する取得手順と、
前記文書情報の構成要素を抽出する抽出手順と、
事物の説明に用いられる複数の用語を該説明における役割の観点から複数のグループに分類して記憶する記憶部を参照して、前記各構成要素が属するグループを判定する判定手順と、
優先順位の高いグループに属すると判定された構成要素を優先して出力対象として選択する選択手順と、
をコンピュータが実行し、
前記抽出手順は、複数の前記構成要素のそれぞれの重要度を抽出し、
前記選択手順は、前記構成要素の出力先に応じて前記グループ及び前記重要度に基づいて出力対象を規定する情報を参照して、同じグループに属すると判定された複数の前記構成要素について、前記重要度に基づいて出力対象とする構成要素を選択する、
ことを特徴とする理解支援方法。
An acquisition procedure for acquiring document information about a certain thing,
An extraction procedure for extracting the constituent elements of the document information,
A determination procedure for determining a group to which each of the constituent elements belongs by referring to a storage unit that stores a plurality of terms used to describe an object by classifying them into a plurality of groups from the viewpoint of the role in the description,
A selection procedure for preferentially selecting a component determined to belong to a group with a high priority as an output target,
The computer runs
The extraction procedure extracts the importance of each of the plurality of components,
The selection procedure refers to the information defining the output target based on the group and the degree of importance according to the output destination of the component, the plurality of the components determined to belong to the same group, the Select the component to be output based on the importance ,
Understand support how to, characterized in that.
或る事物に関する文書情報を取得する取得部と、
前記文書情報の構成要素を抽出する抽出部と、
事物の説明に用いられる複数の用語を該説明における役割の観点から複数のグループに分類して記憶する記憶部を参照して、前記各構成要素が属するグループを判定する判定部と、
優先順位の高いグループから順に、各グループでの最大提示数の規定のもと、合計で決められた最大数以下の構成要素を優先して出力対象として選択する選択部と、
を有することを特徴とする理解支援装置。
An acquisition unit that acquires document information about a certain thing,
An extraction unit for extracting the constituent elements of the document information,
A determination unit that determines a group to which each of the constituent elements belongs by referring to a storage unit that stores a plurality of terms used to describe an object by classifying them into a plurality of groups from the viewpoint of the role in the description,
In order from the group with the highest priority , under the provision of the maximum number of presentations in each group, a selection unit that preferentially selects the constituent elements less than the maximum number determined in total as an output target,
An understanding support device characterized by having.
前記抽出部は、複数の前記構成要素のそれぞれの重要度を抽出し、
前記選択部は、同じグループに属すると判定された複数の前記構成要素について、前記重要度に基づいて出力対象とする構成要素を選択する、
ことを特徴とする請求項4記載の理解支援装置。
The extraction unit extracts each of importance of the components of multiple,
The selection unit includes a plurality of said component which are determined to belong to the same group, to select a component to be outputted is based on the importance,
The understanding support device according to claim 4, wherein
或る事物に関する文書情報を取得する取得部と、
前記文書情報の構成要素を抽出する抽出部と、
事物の説明に用いられる複数の用語を該説明における役割の観点から複数のグループに分類して記憶する記憶部を参照して、前記各構成要素が属するグループを判定する判定部と、
優先順位の高いグループに属すると判定された構成要素を優先して出力対象として選択する選択部と、
を有し、
前記抽出部は、複数の前記構成要素のそれぞれの重要度を抽出し、
前記選択部は、前記構成要素の出力先に応じて前記グループ及び前記重要度に基づいて出力対象を規定する情報を参照して、同じグループに属すると判定された複数の前記構成要素について、前記重要度に基づいて出力対象とする構成要素を選択する、
ことを特徴とする理解支援装置。
An acquisition unit that acquires document information about a certain thing,
An extraction unit for extracting the constituent elements of the document information,
A determination unit that determines a group to which each of the constituent elements belongs by referring to a storage unit that stores a plurality of terms used to describe an object by classifying them into a plurality of groups from the viewpoint of the role in the description,
A selection unit that preferentially selects a component determined to belong to a group with a high priority as an output target,
Have
The extraction unit extracts the importance of each of the plurality of components,
The selecting unit refers to the information defining the output target based on the group and the importance according to the output destination of the constituent element, and for the plurality of constituent elements determined to belong to the same group, Select the component to be output based on the importance ,
Understanding support device characterized in that.
請求項4乃至6いずれか一項記載の各部としてコンピュータを機能させることを特徴とするプログラム。 A program that causes a computer to function as each unit according to any one of claims 4 to 6.
JP2017048540A 2017-03-14 2017-03-14 Understanding support method, understanding support device and program Active JP6707484B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017048540A JP6707484B2 (en) 2017-03-14 2017-03-14 Understanding support method, understanding support device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017048540A JP6707484B2 (en) 2017-03-14 2017-03-14 Understanding support method, understanding support device and program

Publications (2)

Publication Number Publication Date
JP2018151939A JP2018151939A (en) 2018-09-27
JP6707484B2 true JP6707484B2 (en) 2020-06-10

Family

ID=63680512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017048540A Active JP6707484B2 (en) 2017-03-14 2017-03-14 Understanding support method, understanding support device and program

Country Status (1)

Country Link
JP (1) JP6707484B2 (en)

Also Published As

Publication number Publication date
JP2018151939A (en) 2018-09-27

Similar Documents

Publication Publication Date Title
CN105183761B (en) Sensitive word replacing method and device
JP6487201B2 (en) Method and apparatus for generating recommended pages
US8001135B2 (en) Search support apparatus, computer program product, and search support system
US10671619B2 (en) Information processing system and information processing method
JP2005202766A (en) System for simultaneous presentation of similar content
JP5444115B2 (en) Data search apparatus, data search method and program
JP2012515382A (en) Visualize the structure of the site and enable site navigation for search results or linked pages
JP6605410B2 (en) Emotion factor estimation support device, emotion factor estimation support method, and emotion factor estimation support program
JP6932162B2 (en) Area-based item recommendation terminal device and item recommendation information provision method.
CN105765564A (en) Identifying semantically-meaningful text selections
KR20110038247A (en) Apparatus and method for extracting keywords
JP2017072964A (en) Information analyzing apparatus and information analyzing method
KR20130113275A (en) Apparatus and method for visualization of a hyperlink using color attribute value
RU2632126C1 (en) Method and system of providing contextual information
JP2024058648A (en) Service providing device and method for providing search word network for search path base
JP6707484B2 (en) Understanding support method, understanding support device and program
JP6696344B2 (en) Information processing device and program
JP5368900B2 (en) Information presenting apparatus, information presenting method, and program
JP2016045552A (en) Feature extraction program, feature extraction method, and feature extraction device
CN111144122A (en) Evaluation processing method, evaluation processing device, computer system, and medium
KR20130024127A (en) Keyword extraction system for search engines and extracting method thereof
CN113892110A (en) Image-based dish recognition device and method
JP2016192067A (en) Searcher device
JP2020113048A (en) Information processing apparatus and program
JP7323484B2 (en) Information processing device, information processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200520

R150 Certificate of patent or registration of utility model

Ref document number: 6707484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150