JP2016040723A - Article arrangement determination device - Google Patents

Article arrangement determination device Download PDF

Info

Publication number
JP2016040723A
JP2016040723A JP2015197663A JP2015197663A JP2016040723A JP 2016040723 A JP2016040723 A JP 2016040723A JP 2015197663 A JP2015197663 A JP 2015197663A JP 2015197663 A JP2015197663 A JP 2015197663A JP 2016040723 A JP2016040723 A JP 2016040723A
Authority
JP
Japan
Prior art keywords
article
virtual
area
arrangement
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015197663A
Other languages
Japanese (ja)
Inventor
景一 増田
Keiichi Masuda
景一 増田
友基 遠藤
Tomoki Endo
友基 遠藤
健人 巽
Taketo Tatsumi
健人 巽
恵介 木村
Keisuke Kimura
恵介 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Communication Systems Co Ltd
Kyocera Maruzen System Integration Co Ltd
Original Assignee
Kyocera Communication Systems Co Ltd
Kyocera Maruzen System Integration Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Communication Systems Co Ltd, Kyocera Maruzen System Integration Co Ltd filed Critical Kyocera Communication Systems Co Ltd
Priority to JP2015197663A priority Critical patent/JP2016040723A/en
Publication of JP2016040723A publication Critical patent/JP2016040723A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an article arrangement determination device capable of properly arranging content in accordance with article importance.SOLUTION: Virtual article area generating means 2 generates a virtual article area having area based on importance 6 of each article recorded in a recording part 4. Virtual article area arranging means 10 arranges the generated virtual article area on a virtual plane. Virtual spring setting means 12 sets a virtual spring having a spring constant corresponding to degree of association between articles recorded in the recording part 4 between corresponding virtual article areas. Virtual article area arrangement determining means 16 changes and determines arrangement of the virtual article areas arranged on the virtual plane so as to make total power by power total calculating means small. Article area arrangement determining means 18 determines the arrangement of the article areas on the basis of the determined arrangement of the virtual article areas.SELECTED DRAWING: Figure 1a

Description

この発明は、複数の記事をその重要度に応じて、適切に自動配置する装置に関するものである。   The present invention relates to an apparatus that automatically and appropriately arranges a plurality of articles according to their importance.

インターネットを介して、サーバ装置に記録されているコンテンツを、端末装置にて閲覧することが行われている。この際、閲覧に使用される端末装置としては、PC、スマートフォン、タブレットなどがあり、その画面の大きさも様々である。   Browsing the content recorded in the server device on the terminal device via the Internet. At this time, terminal devices used for browsing include PCs, smartphones, tablets, and the like, and the screens have various sizes.

このため、PCのような大画面を有する機器向けに最適に配置したニュース記事などを、スマートフォンなどの小画面しかない機器で閲覧すると、記事全体が表示されなかったり、全体を表示しようとすると極端に文字を小さくしなければならないという問題があった。   For this reason, if you browse news articles that are optimally arranged for devices with a large screen such as a PC on a device that has only a small screen such as a smartphone, the entire article may not be displayed or it may be extremely There was a problem that the characters had to be made smaller.

また、閲覧する端末装置が決まっていたとしても、記事の配置を人間が手作業で決定することは煩わしかった。   Further, even if the terminal device to be browsed is determined, it is troublesome for a human to manually determine the article layout.

そのため、コンテンツを自動的に配置するための装置が提案されている。たとえば、特許文献1には、コンテンツの再配置を自動的に行う装置が開示されている。この装置では、紙面のテーマに対応したコンテンツを検索し、再配置することができる。   Therefore, an apparatus for automatically arranging contents has been proposed. For example, Patent Document 1 discloses an apparatus that automatically rearranges content. With this device, it is possible to search for content corresponding to the theme of the page and rearrange it.

特開2002−318143号公報JP 2002-318143 A

しかしながら、特許文献1の装置は、一旦配置された記事を入れ替えたい時などに、その自動的な再配置を行うものであり、最初からレイアウトを決定するものではない。また、記事の重要度に応じて、適切な記事の配置を自動的に決定することはできなかった。   However, the apparatus of Patent Document 1 performs automatic rearrangement when it is desired to replace an article once arranged, and does not determine the layout from the beginning. Also, it was not possible to automatically determine an appropriate article arrangement according to the importance of the article.

この発明は、上記のような問題点を解決して、記事の重要度に応じて、適切にコンテンツを配置することのできる記事配置決定装置を提供することを目的とする。   An object of the present invention is to solve the above-described problems and to provide an article arrangement determination device that can appropriately arrange contents according to the importance of articles.

(1)(2)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段とを備えている。 (1) (2) An article placement determination device according to the present invention is an article placement determination device that places a plurality of articles on a plane, and records a plurality of articles and the importance of each article, and between each article. A recording section that records the degree of relevance of the article, a virtual article area generating unit that generates a virtual article area corresponding to each article and having an area corresponding to the importance of each article, and a spring corresponding to the degree of association between the articles Virtual spring setting means for setting a virtual spring having a constant between the corresponding virtual article areas; virtual article area arrangement determining means for determining the arrangement of the virtual article areas so that the total attractive force of the virtual springs is reduced; An article area arrangement determining means for determining the arrangement of the article area based on the determined arrangement of the virtual article area.

したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。   Therefore, based on the total force of the virtual springs, a preferable article arrangement can be determined from the viewpoint of importance and relevance.

(3)この発明に係る記事配置決定装置は、仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えている。 (3) The article arrangement determining apparatus according to the present invention further includes force total calculation means for calculating a total value of attractive forces of virtual springs arranged between the virtual article areas arranged on the virtual plane, the virtual article area The placement determination means includes a virtual article area placing means for placing the virtual article area on the virtual plane, and a virtual article area that changes the placement of the virtual article area on the virtual plane so that the total value of the attractive force of the virtual spring is reduced. Virtual article region arrangement change determining means for determining the arrangement of the article.

したがって、配置を変えながら、バネの合計力の変化を見て、適切な配置を選択することができる。   Accordingly, it is possible to select an appropriate arrangement by changing the arrangement and looking at the change in the total force of the spring.

(4)この発明に係る記事配置決定装置は、仮想記事領域生成手段が、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴としている。 (4) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article region generating means generates a circle having an area corresponding to the importance of each article as the virtual article region.

したがって、記事配置のシミュレーションを容易に行うことができる。   Therefore, the article arrangement simulation can be easily performed.

(5)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、最も重要度の高い仮想記事領域を、記事を配置する平面上の右上または左上に固定して配置することを特徴としている。 (5) The article placement determining device according to the present invention is characterized in that the virtual article region placement means places the virtual article region having the highest importance fixed at the upper right or upper left on the plane on which the article is placed. Yes.

したがって、注目度の高い場所に、重要度の高い記事を配置することができる。   Therefore, articles with a high degree of importance can be arranged in places with a high degree of attention.

(6)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴としている。 (6) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article area arranging means arranges the virtual article areas in order from a pair of virtual article areas having a high degree of association.

したがって、関連度の大きい記事を離さずに配置することが可能となる。   Therefore, articles with a high degree of relevance can be arranged without being separated.

(7)この発明に係る記事配置決定装置は、仮想バネ設定手段が、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴としている。 (7) The article arrangement determining apparatus according to the present invention is characterized in that the virtual spring setting means sets the virtual spring so that no attractive force is generated between the virtual article regions that are in contact with each other. .

したがって、両仮想記事領域を離そうとした場合には引力が働くことになり、この引力の合計の大きさを小さくすることで、適切な配置を選択することができる。   Therefore, an attractive force is applied when trying to separate both virtual article regions, and an appropriate arrangement can be selected by reducing the total size of the attractive force.

(8)この発明に係る記事配置決定装置は、仮想バネ設定手段が、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴としている。 (8) The article placement determining apparatus according to the present invention is characterized in that the virtual spring setting means increases the spring constant as the degree of association between articles increases.

したがって、関連度の高い記事であるほど、離そうとすると大きな引力が働くようにシミュレーションすることができる。   Therefore, it is possible to perform a simulation so that an article having a higher degree of relevance has a greater attractive force when it is released.

(9)この発明に係る記事配置決定装置は、仮想記事領域配置変更決定手段が、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴としている。 (9) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article area arrangement change determining means changes the arrangement by paying attention to a virtual article area related to a virtual spring having the greatest attraction.

したがって、配置変更により、合計力が小さくなる可能性が高くなる。   Therefore, there is a high possibility that the total force is reduced by the arrangement change.

(10)(11)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段とを備えている。 (10) (11) An article placement determination device according to the present invention is an article placement determination device that places a plurality of articles on a plane, and records a plurality of articles and the importance of each article, and between each article. A recording section that records the degree of relevance of the article, a virtual article area generating unit that generates a virtual article area corresponding to each article and having an area corresponding to the importance of each article, and at least the most generated virtual article area A virtual article area having a large importance is fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are allowed to overlap each other on the virtual plane. Virtual article region placement means as a movable virtual article region placed far away, and virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions; , The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. The article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area a fixed virtual article area.

したがって、配置変更などを行わなくとも、容易に適切な配置を実現することができる。   Therefore, an appropriate arrangement can be easily realized without changing the arrangement.

(12)この発明に係る記事配置決定装置は、解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段とをさらに備えている。 (12) The article arrangement determining device according to the present invention analyzes an article to be analyzed, extracts at least a noun constituting the article as a word, and each of the articles included in the article extracted by the word extracting means Importance calculating means for calculating the importance of each word and calculating the importance of each article based on the importance of each word.

したがって、単語の重要度に基づいて記事の重要度を算出することができる。   Therefore, the importance of an article can be calculated based on the importance of a word.

(13)この発明に係る記事配置決定装置は、各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段をさらに備えたことを特徴としている。 (13) The article arrangement determining apparatus according to the present invention is characterized by further comprising a relevance calculation means for calculating a relevance between articles based on words included in each article.

したがって、単語に基づいて、両記事間の関連度を算出することができる。   Therefore, the degree of association between both articles can be calculated based on the word.

(14)この発明に係る記事配置決定装置は、関連度算出手段が、各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段とを備えている。
(14) In the article arrangement determining device according to the present invention, the degree-of-relevance calculating means determines important words from the top with high importance in each article as important words,
Relevance between words that search for important words contained in one article for calculating the degree of association and important words contained in the other article for which the degree of association is calculated on a search site on the web and obtain the number of hits The relevance obtained by the inter-word relevance calculating means is changed by changing the combination of the inter-word relevance calculating means, the important word included in the one article, and the important word included in the other article. And an inter-article relevance calculating means for calculating the relevance between both articles.

したがって、検索サイトを利用して記事間の関連度を算出することができる。   Therefore, the degree of association between articles can be calculated using the search site.

(15)この発明に係る記事配置決定方法は、コンピュータによって平面上における複数の記事配置を決定する方法であって、当該コンピュータは、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、生成された仮想記事領域を仮想平面上に配置し、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴としている。 (15) The article arrangement determining method according to the present invention is a method of determining a plurality of article arrangements on a plane by a computer, the computer corresponding to each article, and having an area corresponding to the importance of each article. A virtual article region having the virtual article region is arranged on a virtual plane, and a virtual spring having a spring constant according to the degree of association between each article is set between the corresponding virtual article regions, The placement of the virtual article area on the virtual plane is changed, the placement of the virtual article area is determined such that the total attractive force of the virtual spring is reduced, and the placement of the article area is determined based on the determined placement of the virtual article area. It is characterized by deciding.

したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。   Therefore, based on the total force of the virtual springs, a preferable article arrangement can be determined from the viewpoint of importance and relevance.

「仮想記事領域生成手段」は、実施形態においては、ステップS71がこれに対応する。   In the embodiment, “virtual article region generation means” corresponds to step S71.

「仮想記事領域配置決定手段」は、実施形態においては、ステップS22〜32、S40、S41がこれに対応する。   In the embodiment, the “virtual article region arrangement determining unit” corresponds to steps S22 to S32, S40, and S41.

「仮想記事領域配置手段」は、実施形態においては、ランダムに仮想記事領域を配置する処理を実行するCPU34がこれに対応する。   In the embodiment, the “virtual article area arranging means” corresponds to the CPU 34 that executes a process of randomly arranging the virtual article areas.

「仮想記事領域配置変更決定手段」は、実施形態においては、仮想記事領域の配置を入れ替える処理を実行するCPU34がこれに対応する。   In the embodiment, the “virtual article area arrangement change determining unit” corresponds to the CPU 34 that executes the process of changing the arrangement of the virtual article areas.

「仮想バネ設定手段」は、実施形態においては、ステップS22がこれに対応する。   In the embodiment, “virtual spring setting means” corresponds to step S22.

「力合計算出手段」は、実施形態においては、バネの引力を合計する処理を実行するCPU34がこれに対応する。   In the embodiment, the “total force calculation unit” corresponds to the CPU 34 that executes the process of totaling the attractive forces of the springs.

「記事領域配置決定手段」は、実施形態においては、ステップS33がこれに対応する。   In the embodiment, “article region arrangement determining means” corresponds to step S33.

「単語抽出手段」は、実施形態においては、ステップS2がこれに対応する。   In the embodiment, “word extracting means” corresponds to step S2.

「重要度算出手段」は、実施形態においては、ステップS3〜S8がこれに対応する。   In the embodiment, “importance calculation means” corresponds to steps S3 to S8.

「関連度算出手段」は、実施形態においては、ステップS10〜S18がこれに対応する。   In the embodiment, “relevance calculation means” corresponds to steps S10 to S18.

「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
The “program” is a concept that includes not only a program that can be directly executed by the CPU, but also a source format program, a compressed program, an encrypted program, and the like.

この発明の一実施形態による記事配置決定装置の機能ブロック図である。It is a functional block diagram of the article arrangement | positioning determination apparatus by one Embodiment of this invention. この発明の一実施形態による重要度・関連度算出装置の機能ブロック図である。It is a functional block diagram of an importance / relevance calculation device according to an embodiment of the present invention. 記事領域配置装置および重要度・関連度算出装置のハードウエア構成である。This is a hardware configuration of an article area arrangement device and an importance / relevance calculation device. 重要度・関連度算出プログラムのフローチャートである。It is a flowchart of the importance / relevance calculation program. 重要度・関連度算出プログラムのフローチャートである。It is a flowchart of the importance / relevance calculation program. 形態素解析プログラムのフローチャートである。It is a flowchart of a morphological analysis program. 形態素解析の結果を示す図である。It is a figure which shows the result of a morphological analysis. 形態素解析の結果を示す図である。It is a figure which shows the result of a morphological analysis. 重要度を算出する課程を示す図である。It is a figure which shows the process which calculates importance. 算出された各記事の重要度を示す図である。It is a figure which shows the importance of each calculated article. IDF値算出処理のフローチャートである。It is a flowchart of an IDF value calculation process. Hot係数算出処理のフローチャートである。It is a flowchart of a Hot coefficient calculation process. 辞書サイトからの返信データを示す図である。It is a figure which shows the reply data from a dictionary site. Hot係数を算出するための係数表である。It is a coefficient table | surface for calculating a Hot coefficient. 記事K1とK2の重要単語を示す図である。It is a figure which shows the important word of articles K1 and K2. 算出した関連度を示す図である。It is a figure which shows the calculated relevance degree. 記事配置決定プログラムのフローチャートである。It is a flowchart of an article arrangement | positioning determination program. 記事配置決定プログラムのフローチャートである。It is a flowchart of an article arrangement | positioning determination program. 記事配置決定プログラムのフローチャートである。It is a flowchart of an article arrangement | positioning determination program. 大きい順に並べた関連度のテーブルである。It is a table of relevance arranged in descending order. 仮想記事領域の配置手順を説明するための図である。It is a figure for demonstrating the arrangement | positioning procedure of a virtual article area | region. 仮想記事領域の配置手順を説明するための図である。It is a figure for demonstrating the arrangement | positioning procedure of a virtual article area | region. 仮想記事領域の配置手順を説明するための図である。It is a figure for demonstrating the arrangement | positioning procedure of a virtual article area | region. 仮想記事領域の配置手順を説明するための図である。It is a figure for demonstrating the arrangement | positioning procedure of a virtual article area | region. 仮想記事領域の配置手順を説明するための図である。It is a figure for demonstrating the arrangement | positioning procedure of a virtual article area | region. 仮想記事領域を記事領域に変形する手順を示すための図である。It is a figure for showing a procedure which transforms a virtual article field into an article field. 決定された記事配置を示す図である。It is a figure which shows the determined article arrangement | positioning. 仮想バネを示す図である。It is a figure which shows a virtual spring. 他の実施形態による仮想記事領域の配置決定を示す図である。It is a figure which shows arrangement | positioning determination of the virtual article area | region by other embodiment. 要約文生成プログラムのフローチャートである。It is a flowchart of a summary sentence generation program. 要約文生成プログラムのフローチャートである。It is a flowchart of a summary sentence generation program. 記事の例を示す図である。It is a figure which shows the example of an article. 文に分解した記事を示す図である。It is a figure which shows the article decomposed | disassembled into the sentence. 各文について算出した重要度を示す図である。It is a figure which shows the importance calculated about each sentence. 生成された要約文を示す図である。It is a figure which shows the produced | generated summary sentence.

1.記事配置決定装置の機能ブロック図
図1aに、この発明の一実施形態による記事配置決定装置の機能ブロック図を示す。仮想記事領域生成手段2は、記録部4に記録された各記事の重要度6に基づいた面積を有する仮想記事領域を生成する。仮想記事領域配置手段10は、生成された仮想記事領域を、仮想平面上に配置する。
1. Functional Block Diagram of Article Placement Determination Device FIG. 1a shows a functional block diagram of an article placement determination device according to an embodiment of the present invention. The virtual article region generating unit 2 generates a virtual article region having an area based on the importance 6 of each article recorded in the recording unit 4. The virtual article area arrangement unit 10 arranges the generated virtual article area on a virtual plane.

仮想バネ設定手段12は、記録部4に記録された記事間の関連度に応じたバネ定数を有する仮想バネを、対応する仮想記事領域間に設定する。仮想記事領域配置変更決定手段16は、力合計算出手段による合計力が小さくなるように、仮想平面上に配置された仮想記事領域の配置を変更して、決定する。記事領域配置決定手段18は、決定された仮想記事領域の配置に基づいて、記事領域の配置を決定する。   The virtual spring setting means 12 sets a virtual spring having a spring constant corresponding to the degree of association between articles recorded in the recording unit 4 between corresponding virtual article regions. The virtual article area arrangement change determining unit 16 changes and determines the arrangement of the virtual article areas arranged on the virtual plane so that the total force by the force total calculating unit is reduced. The article area arrangement determining means 18 determines the arrangement of the article area based on the determined arrangement of the virtual article area.

図1bに、図1aの記事配置決定装置とともに用いる重要度・関連度算出装置の機能ブロック図を示す。単語抽出手段22は、記録部4に記録されている各記事20に含まれる単語を抽出する。重要度算出手段24は、抽出した単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する。算出した各記事の重要度は、各記事に対応づけて記録される。関連度算出手段26は、各記事に含まれる単語の重要度に基づいて、各記事間の関連度を算出する。たとえば、両記事における重要度の高い単語を組み合わせて検索サイトにて検索を行い、当該単語の組み合わせによるヒット件数の数によって関連度を決定する。以上のようにして算出された記事の重要度および記事間の関連度は、図1aの記録部4に記録される。
FIG. 1b shows a functional block diagram of an importance / relevance calculation device used with the article arrangement determination device of FIG. 1a. The word extraction unit 22 extracts words included in each article 20 recorded in the recording unit 4. The importance calculation means 24 calculates the importance of the extracted word, and calculates the importance of each article based on the importance of each word. The calculated importance of each article is recorded in association with each article. The degree-of-association calculating means 26 calculates the degree of association between articles based on the importance of words included in each article. For example, a search is performed on a search site by combining words having high importance in both articles, and the relevance is determined based on the number of hits by the combination of the words. The importance level of articles and the degree of association between articles calculated as described above are recorded in the recording unit 4 in FIG. 1a.

2.ハードウエア構成
図2に、図1a、図1bに示す記事配置決定装置および重要度・関連度算出装置のハードウエア構成を示す。CPU34には、メモリ36、ディスプレイ38、ハードディスク40、CD−ROMドライブ42、キーボード/マウス44、通信回路46が接続されている。通信回路46は、インターネットなどに接続するためのものである。
2. Hardware Configuration FIG. 2 shows a hardware configuration of the article arrangement determination device and the importance / relevance calculation device shown in FIGS. 1a and 1b. A memory 36, a display 38, a hard disk 40, a CD-ROM drive 42, a keyboard / mouse 44, and a communication circuit 46 are connected to the CPU 34. The communication circuit 46 is for connecting to the Internet or the like.

ハードディスク40には、WINDOWS(商標)などのオペレーティングシステム50、重要度・関連度算出プログラム52、記事配置決定プログラム53、形態素辞書54、複数の記事20が記録されている。オペレーティングシステム50、重要度・関連度算出プログラム52、記事配置決定プログラム53は、CD−ROM48に記録されていたものをCD−ROMドライブ42を介して、インストールしたものである。形態素辞書54には、単語とその品詞が対応づけて記録されている。
On the hard disk 40, an operating system 50 such as WINDOWS (trademark), an importance / relevance calculation program 52, an article placement determination program 53, a morpheme dictionary 54, and a plurality of articles 20 are recorded. The operating system 50, the importance / relevance calculation program 52, and the article arrangement determination program 53 are installed on the CD-ROM 48 via the CD-ROM drive 42. The morpheme dictionary 54 records words and their parts of speech in association with each other.

3.重要度・関連度算出プログラム
重要度・関連度算出プログラム52のフローチャートを、図3、図4に示す。CPU34は、ハードディスク40に記録された記事20のうち、最初の記事20を対象記事とする(ステップS1)。
3. Importance / Relevance Calculation Program Flow charts of the importance / relevance calculation program 52 are shown in FIGS. The CPU 34 sets the first article 20 among the articles 20 recorded on the hard disk 40 as a target article (step S1).

CPU34は、記事に含まれる全ての文を対象として、形態素解析を行う(ステップS2)。図5に、形態素解析処理の詳細を示す。まず、CPU34は、ハードディスク40に記録されている形態素辞書54を参照して、記事の形態素を解析する(ステップS21)。この形態素解析は、従来より行われている一般的な手法を用いることができる。形態素解析の結果を、図6に示す。   The CPU 34 performs morphological analysis on all sentences included in the article (step S2). FIG. 5 shows details of the morphological analysis process. First, the CPU 34 refers to the morpheme dictionary 54 recorded on the hard disk 40 and analyzes the morpheme of the article (step S21). This morphological analysis can be performed by using a general method that has been conventionally performed. The result of morphological analysis is shown in FIG.

次に、CPU34は、通信回路46を使用して、インターネットを介して、ウエブ上の百科事典や辞書(たとえばWikipedia(商標)やe-Words(商標))にアクセスする。そして、図6に示す形態素解析によって得られた連続する単語を結合し、これをウエブ上の百科事典や辞書、検索サイトにて検索する(ステップS22)。たとえば、「平素」と「は」を結合して「平素は」という単語を生成し、この単語が見出し語としてウエブ上の百科事典や辞書に存在するかどうか、あるいは検索サイトにおいて所定件数以上(たとえば1万件以上)ヒットするかどうかを検索する。たとえば、「平素+は」「格別+の」「IT+ソリューション」などは、ウエブ上で文節として使用されている例が多くあるので、検索サイトにおける検索で所定件数以上のヒットを得ることができる。また、「電子+書籍」などの単語は、百科事典や辞書の見出し語として存在する可能性がある。   Next, the CPU 34 uses the communication circuit 46 to access an encyclopedia or dictionary (for example, Wikipedia (trademark) or e-Words (trademark)) on the web via the Internet. Then, continuous words obtained by the morphological analysis shown in FIG. 6 are combined and searched for in an encyclopedia, dictionary, or search site on the web (step S22). For example, “plain” and “ha” are combined to generate the word “plain is” and whether this word is found as an entry word in an encyclopedia or dictionary on the web, or more than a predetermined number ( (For example, 10,000 or more) Search whether it hits. For example, “Plain + Ha”, “Extraordinary +”, “IT + Solution”, etc. are often used as clauses on the web, so it is possible to obtain more than a predetermined number of hits in a search on a search site. In addition, words such as “electronic + book” may exist as headwords in encyclopedias and dictionaries.

なお、この実施形態では、文の初めの単語を対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の百科事典・辞書に存在する、または検索サイトにて所定件数以上ヒットするものを抽出する。CPU34は、このようにして抽出した結合単語(たとえば「平素は」)を、図6のテーブルに記録するとともに、結合単語を構成する個々の単語(たとえば「平素」「は」)を図6のテーブルから削除する。これにより、テーブルは、図7に示すようになる。さらに、CPU34は、見いだされた結合単語を、形態素辞書54に追加登録する。   In this embodiment, the first word of the sentence is used as the target word, the subsequent words are sequentially combined, and the longest word exists in the encyclopedia / dictionary on the web, or a predetermined number or more on the search site. Extract hits. The CPU 34 records the combined words (for example, “plain”) extracted in this way in the table of FIG. 6, and each word (for example, “plain” “ha”) constituting the combined word in FIG. 6. Delete from the table. As a result, the table becomes as shown in FIG. Further, the CPU 34 additionally registers the found combined word in the morpheme dictionary 54.

続いて、抽出された単語の次の単語(抽出されなかった場合は対象単語の次の単語)を次の対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の辞書に存在するものを抽出する。この処理を、文末まで繰り返す。   Next, the next word after the extracted word (or the next word after the target word if it is not extracted) is used as the next target word, and subsequent words are sequentially combined, and the dictionary on the web as the longest word Extract what exists in. This process is repeated until the end of the sentence.

したがって、この実施形態によれば、形態素辞書54に登録されていない単語であっても、これを単語として抽出することができる。   Therefore, according to this embodiment, even a word that is not registered in the morpheme dictionary 54 can be extracted as a word.

続いて、CPU34は、上記で得た単語を結合する処理を行う(ステップS23)。たとえば、名詞が連続する場合にはこれを結合して一つの名詞とする。「福島」「第一」「原子力」「発電所」という4つの名詞が連続する場合、これを「福島第一原子力発電所」とする。同様に、人名の姓と名が連続する場合、これを結合する。その他、形態素の結合として一般に行われている手法を用いて、単語の結合を行う。CPU34は、得られた結合単語(たとえば、「福島第一原子力発電所」)を、図7のテーブルに記録するとともに、結合単語を構成する個々の単語(たとえば、「福島」「第一」「原子力」「発電所」)を図7のテーブルから削除する。   Subsequently, the CPU 34 performs processing for combining the words obtained above (step S23). For example, when nouns are continuous, they are combined into one noun. If the four nouns “Fukushima”, “Daily”, “Nuclear Power”, and “Power Plant” are consecutive, this is designated as “Fukushima Daiichi Nuclear Power Plant”. Similarly, if the surname and first name of a person name are consecutive, they are combined. In addition, words are combined using a method generally used for combining morphemes. The CPU 34 records the obtained combined word (for example, “Fukushima Daiichi Nuclear Power Station”) in the table of FIG. 7 and also makes individual words (for example, “Fukushima”, “First”, “ "Nuclear power" "Power plant") is deleted from the table of FIG.

以上のようにして、形態素解析を行うことができる。   As described above, morphological analysis can be performed.

(3)TF値算出
次に、CPU34は、上記にて抽出した単語(この実施形態では名詞を含む単語のみを対象とする)について、TF(Term Frequency)値を算出する(ステップS3)。つまり、図7のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、TF値を算出する。
(3) TF Value Calculation Next, the CPU 34 calculates a TF (Term Frequency) value for the word extracted above (in this embodiment, only words including nouns are targeted) (step S3). That is, the TF value is calculated for a word whose part of speech recorded in the table of FIG. 7 is a noun and a word including the noun as a part of speech.

ここで、TF値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。   Here, the TF value is a value obtained by dividing the number of times the word appears in the sentence by the total number of words in the sentence.

TF=単語の出現回数/各単語の出現回数の合計
図8aに、各単語について算出したTF値を示す。CPU34は、算出したTF値をハードディスク40に記録する。
TF = number of appearances of words / total number of appearances of each word FIG. 8a shows the TF value calculated for each word. The CPU 34 records the calculated TF value on the hard disk 40.

この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。   In this embodiment, by obtaining the appearance frequency of each word in the sentence, how much each word is emphasized in the sentence is calculated.

(4)IDF値算出
次に、CPU34は、各単語についてIDF(Inverse Document Frequency)値を算出する(ステップS4)。ここで、IDF値は、各単語の希少性(世間に流通している単語として一般的でないこと)を表すものである。当該単語の希少性が高いほど、IDF値は高くなる。
(4) IDF value calculation Next, the CPU 34 calculates an IDF (Inverse Document Frequency) value for each word (step S4). Here, the IDF value represents the rarity of each word (that is not common as a word circulating in the world). The higher the rarity of the word, the higher the IDF value.

この実施形態では、IDF値は、以下の式により算出するようにしている。   In this embodiment, the IDF value is calculated by the following equation.

IDF=log(当該単語の検索エンジンでのヒット数(ページ数)/検索エンジン上の総ページ数)
図9に、IDF値算出処理の詳細を示す。CPU34は、図7のテーブルに記録された最初の単語(この実施形態では名詞を含む単語のみを対象とする)を対象単語とする(ステップS41)。CPU34は、対象単語(たとえば「平素は」)を、インターネット上の検索サイト(たとえばYahoo!(商標)やgoogle(商標)など)にて検索する(ステップS42)。
IDF = log (number of hits (number of pages) in the search engine of the word / total number of pages on the search engine)
FIG. 9 shows details of the IDF value calculation process. The CPU 34 sets the first word recorded in the table of FIG. 7 (in this embodiment, only a word including a noun is targeted) as a target word (step S41). The CPU 34 searches for a target word (for example, “Peace is”) on a search site (for example, Yahoo! (trademark) or google (trademark)) on the Internet (step S42).

この検索リクエストに応じて、検索サイトから検索結果が返信されてくるので、CPU34はこれを受信する。CPU34は、検索結果に含まれる対象単語のヒット数(当該単語が含まれるページ数)および検索サイトが対象としている総ページ数を取得し、メモリ36に記録する(ステップS43)。   In response to this search request, the search result is returned from the search site, so the CPU 34 receives it. The CPU 34 acquires the number of hits of the target word included in the search results (the number of pages including the word) and the total number of pages targeted by the search site, and records them in the memory 36 (step S43).

続いて、CPU34は、log(当該単語の検索エンジンでのヒット数(ページ数)/検索エンジン上の総ページ数)を計算して、IDF値を算出する(ステップS44)。CPU34は、算出したIDF値を、各単語に対応づけてハードディスク40に記録する(図8a参照)。   Subsequently, the CPU 34 calculates log (number of hits (number of pages) in the search engine of the word / total number of pages on the search engine) and calculates an IDF value (step S44). The CPU 34 records the calculated IDF value in the hard disk 40 in association with each word (see FIG. 8a).

CPU34は、すべての単語についてIDF値を算出したかどうかを判断する(ステップS45)。図7のテーブルにおいて未処理の単語が残っていれば、CPU34は、次の単語を対象単語とする(ステップS46)。そして、ステップS42以下を繰り返す。このようにして、対象となる全ての単語についてIDF値を算出する。   The CPU 34 determines whether or not IDF values have been calculated for all words (step S45). If an unprocessed word remains in the table of FIG. 7, the CPU 34 sets the next word as a target word (step S46). Then, step S42 and subsequent steps are repeated. In this way, IDF values are calculated for all target words.

(5)TF−IDF値算出
続いて、CPU34は、各単語につき、算出したTF値とIDF値に基づいて、TF−IDF値を計算する(ステップS5)。この実施形態では、TF値とIDF値との積を算出することにより、TF−IDF値を算出するようにしている。
(5) TF-IDF value calculation Subsequently, the CPU 34 calculates a TF-IDF value for each word based on the calculated TF value and IDF value (step S5). In this embodiment, the TF-IDF value is calculated by calculating the product of the TF value and the IDF value.

(6)Hot係数算出
続いて、CPU34は、Hot係数を算出する(ステップS6)。ここで、Hot係数とは、対象となる単語の現在における注目度を表す指数である。この実施形態では、ウエブ上の辞書において対象単語を検索し、当該対象単語がどの程度の頻度で、どの程度現在に近い時間で更新されているかを取得し、これに基づいて算出するようにしている。
(6) Hot coefficient calculation Subsequently, the CPU 34 calculates a Hot coefficient (step S6). Here, the Hot coefficient is an index representing the current attention level of the target word. In this embodiment, a target word is searched in a dictionary on the web, and how often the target word is updated and how close it is to the present time is acquired and calculated based on this. Yes.

具体的には、当該単語について、最新の更新日から所定件数(たとえば100件)の更新日を取得し、これら更新日の平均日を算出して、現在の日との差を求める。この差が小さいほど、Hot係数を大きくする。   Specifically, for the word, a predetermined number (for example, 100) of update dates are acquired from the latest update date, an average date of these update dates is calculated, and a difference from the current date is obtained. The smaller the difference, the larger the Hot coefficient.

図10に、Hot係数算出処理の詳細を示す。CPU34は、図7のテーブルに記録された最初の単語(この実施形態では名詞を含む単語のみを対象とする)を対象単語とする(ステップS61)。CPU34は、対象単語を、インターネット上の辞書(ウエブ辞書)にアクセスし検索する(ステップS62)。   FIG. 10 shows details of the Hot coefficient calculation process. The CPU 34 sets the first word recorded in the table of FIG. 7 (in this embodiment, only a word including a noun is targeted) as a target word (step S61). The CPU 34 searches for a target word by accessing a dictionary (web dictionary) on the Internet (step S62).

対象単語が見出し語として存在すれば、当該対象単語に対する説明などのデータが返信されてくる。見出し語として存在しなければ、存在しない旨(あるいはエラー)が返信されてくる。CPU34は、これを受けて、対象単語がウエブ上の辞書に見出し語として存在するかどうかを判断する(ステップS63)。   If the target word exists as a headword, data such as an explanation for the target word is returned. If it does not exist as a headword, a message that it does not exist (or an error) is returned. In response to this, the CPU 34 determines whether or not the target word exists as a headword in the dictionary on the web (step S63).

見出し語として存在する場合、CPU34は、返信されてきた解説データ中に記録されている更新日を、最新のものから所定件数(ここでは100件)取得する(ステップS64)。   If it exists as a headword, the CPU 34 obtains a predetermined number (in this case, 100) of update dates recorded in the returned commentary data from the latest (step S64).

図11に、返信されてくる解説データの例を示す。見出し語、内容などの項目の他、更新日の項目が設けられている。この更新日には、内容等について更新が行われた履歴が順に示されている。CPU34は、この更新日を最新のものから100件取得する。なお、更新が100件以下の場合には、当該単語のHot係数を1.0として、ステップS68に進む。   FIG. 11 shows an example of comment data returned. In addition to items such as headwords and contents, items of update date are provided. On this update date, the history in which the contents etc. have been updated is shown in order. The CPU 34 acquires 100 update dates from the latest. If the number of updates is 100 or less, the hot coefficient of the word is set to 1.0 and the process proceeds to step S68.

次に、CPU34は、取得した100件の更新日の平均日を算出する。次に、CPU34は、現在日(内部時計に基づく)と平均日との差(絶対値)を算出する(ステップS66)。さらに、算出した差に基づいてHot係数を算出する(ステップS67)。   Next, the CPU 34 calculates the average date of the acquired 100 update dates. Next, the CPU 34 calculates the difference (absolute value) between the current date (based on the internal clock) and the average date (step S66). Further, a Hot coefficient is calculated based on the calculated difference (step S67).

この実施形態では、ハードディスク40に予め記録された係数テーブル(図12参照)に基づいてHot係数を決定する。たとえば、算出した差が10日であれば、Hot係数は2.6として決定される。CPU34は、算出したHot係数を、対象単語に対応づけて記録する(図8a参照)。   In this embodiment, the Hot coefficient is determined based on a coefficient table (see FIG. 12) recorded in advance on the hard disk 40. For example, if the calculated difference is 10 days, the Hot coefficient is determined as 2.6. The CPU 34 records the calculated Hot coefficient in association with the target word (see FIG. 8a).

CPU34は、すべての単語についてHot係数を算出したかどうかを判断する(ステップS68)。図7のテーブルにおいて未処理の単語が残っていれば、CPU34は、次の単語を対象単語とする(ステップS69)。そして、ステップS62以下を繰り返す。このようにして、対象となる全ての単語についてHot係数を算出する。   The CPU 34 determines whether or not the Hot coefficient has been calculated for all words (step S68). If an unprocessed word remains in the table of FIG. 7, the CPU 34 sets the next word as a target word (step S69). Then, step S62 and subsequent steps are repeated. In this way, the Hot coefficient is calculated for all target words.

なお、対象単語がウエブ上の辞書に見出し語として存在しない場合には、Hot係数を1.0とする(ステップS70)。   If the target word does not exist as an entry word in the dictionary on the web, the Hot coefficient is set to 1.0 (step S70).

(7)重要度・関連度の算出
CPU34は、各単語につき、TF−IDF値にHot係数を乗じて、重要度を算出する(図3のステップS7)。CPU34は、このようにして算出した重要度を、対象単語に対応づけて記録する(図8a参照)。続いて、CPU34は、対象記事に含まれる単語の重要度を総合計し、記事の重要度を算出する(ステップS8)。CPU34は、算出した重要度を、対応する記事に関連づけてハードディスク40に記録する(図8b参照)。
(7) Calculation of Importance / Relevance The CPU 34 calculates the importance for each word by multiplying the TF-IDF value by the Hot coefficient (step S7 in FIG. 3). The CPU 34 records the importance calculated in this way in association with the target word (see FIG. 8a). Subsequently, the CPU 34 totalizes the importance levels of the words included in the target article, and calculates the importance level of the article (step S8). The CPU 34 records the calculated importance on the hard disk 40 in association with the corresponding article (see FIG. 8b).

続いて、CPU34は、全ての記事について処理をしたかどうかを判断する(ステップS9)。未処理の記事が残っていれば、次の記事を対象記事とする(ステップS19)。全ての記事について処理をしたのであれば、CPU34は、記事間の関連度の算出処理に移る。   Subsequently, the CPU 34 determines whether or not all articles have been processed (step S9). If an unprocessed article remains, the next article is set as a target article (step S19). If all articles have been processed, the CPU 34 proceeds to a process for calculating the degree of association between articles.

CPU34は、まず、i=1、j=i+1に設定する(ステップS10)。次に、記事K1(数字は、ハードディスク40に記録された記事の順序を表す)に含まれる単語のうち、重要度の高いものから10語を抽出する(ステップS11)。また、記事K2に含まれる単語のうち、重要度の高いものから10語を抽出する(ステップS12)。ここでは、図13に示すように、記事K1の重要単語と、記事K2の重要単語が選択されたものとする。   The CPU 34 first sets i = 1 and j = i + 1 (step S10). Next, ten words are extracted from the words included in the article K1 (numbers indicate the order of the articles recorded in the hard disk 40) from the most important words (step S11). Also, ten words are extracted from the words having the highest importance among the words included in the article K2 (step S12). Here, as shown in FIG. 13, it is assumed that the important word of the article K1 and the important word of the article K2 are selected.

次に、CPU34は、記事K1の重要単語の一つと、記事K2の重要単語の一つとを組み合わせ、当該組み合わせた用語について、通信回路46を介して、インターネット上の検索エンジンにて検索を行う。CPU34は、検索結果として送られてくるヒット数を取得する(ステップS13)。このような検索を、記事K1の重要単語と、記事K2の重要単語のすべのて組合せについて行う。したがって、ここでは、10×10=100件の検索が行われることになる。   Next, the CPU 34 combines one of the important words of the article K1 and one of the important words of the article K2, and searches for the combined terms using a search engine on the Internet via the communication circuit 46. The CPU 34 acquires the number of hits sent as a search result (step S13). Such a search is performed for all combinations of the important words of the article K1 and the important words of the article K2. Therefore, here, 10 × 10 = 100 searches are performed.

CPU34は、これら検索結果としてのヒット数を合計し、合計ヒット件数を記事K1と記事K2の関連度R1,2として25億ヒット(億の単位にて四捨五入)をハードディスク40に記録する(ステップS14)。   The CPU 34 totals the number of hits as the search results, and records 2.5 billion hits (rounded to the nearest 100 million) on the hard disk 40 as the relevance level R1,2 between the article K1 and the article K2 (step S14). ).

次に、jをインクリメントし(ステップS15)、記事K1と記事K3の関連度R1,3を、上記と同様の処理によって算出する(ステップS10〜S14)。この処理を繰り返し、記事K1と記事K5の関連度R1,5までを算出すると(つまり、j=5を超えると)、CPU34はiをインクリメントする(ステップS16、S17)。また、jをi+1とする(ステップS17)。これにより、iは2、jは3となる。   Next, j is incremented (step S15), and the degree of association R1,3 between the article K1 and the article K3 is calculated by the same process as described above (steps S10 to S14). When this process is repeated until the degree of association R1,5 between the article K1 and the article K5 is calculated (that is, when j = 5 is exceeded), the CPU 34 increments i (steps S16 and S17). Further, j is set to i + 1 (step S17). As a result, i becomes 2 and j becomes 3.

CPU34は、ステップS11以下を繰り返す。これにより、関連度R2,3、R2.4、R2,5が算出されることになる。さらに、iがインクリメントされ、関連度R3,4、R3,5が算出される。つづいて、関連度R4,5が算出される。 以上のようにして、各記事の重要度および各記事間の関連度が算出される。   The CPU 34 repeats step S11 and subsequent steps. Thereby, the relevance R2,3, R2.4, R2,5 is calculated. Further, i is incremented, and the relevance degrees R3,4, R3,5 are calculated. Subsequently, the relevance R4, 5 is calculated. As described above, the importance of each article and the relevance between each article are calculated.

(8)記事の配置
次に、CPU34は、記事配置決定プログラム53に基づき、各記事の配置を決定する。記事配置決定プログラム53のフローチャートを図15〜図17に示す。この実施形態では、記事間の関連度の大きさに比例した仮想バネが仮想記事領域間に設けられているものとし、仮想記事領域を配置した際の仮想バネの引力の合計が小さくなるように配置するようにしている。
(8) Article Arrangement Next, the CPU 34 determines the arrangement of each article based on the article arrangement determination program 53. Flow charts of the article placement determination program 53 are shown in FIGS. In this embodiment, it is assumed that virtual springs proportional to the degree of relevance between articles are provided between the virtual article areas, and the total attractive force of the virtual springs when the virtual article areas are arranged is reduced. I try to arrange it.

まず、CPU34は、各記事の重要度に比例した大きさの仮想記事領域を円として生成する(ステップS71)。次に、CPU34は、関連度Rの大きい順に記事KiとKjのペアをテーブルに記憶する(ステップS72、図18参照)。また、CPU34は、これら記事ペアの間に、関連度の大きさに応じたバネ定数を有する仮想バネをかける。   First, the CPU 34 generates a virtual article region having a size proportional to the importance of each article as a circle (step S71). Next, the CPU 34 stores pairs of articles Ki and Kj in descending order of the degree of relevance R (see step S72, FIG. 18). Further, the CPU 34 applies a virtual spring having a spring constant corresponding to the degree of relevance between these article pairs.

この実施形態では、図26Aに示すように、2つの仮想記事領域が接している状態において、仮想バネが自然長の状態となるように、仮想バネを仮想記事間にかけるようにしている。仮想記事領域が離れると、バネ定数の大きさに応じた引力が働くことになる。つまり、関連性の大きい記事ペアを離すと、仮想バネに大きな引力が生じることになる。   In this embodiment, as shown in FIG. 26A, in a state where two virtual article regions are in contact, a virtual spring is applied between the virtual articles so that the virtual spring is in a natural length state. When the virtual article region is separated, an attractive force according to the magnitude of the spring constant is applied. In other words, if an article pair with high relevance is released, a large attractive force is generated in the virtual spring.

そこで、この実施形態では、仮想記事領域を配置したときの仮想バネの引力の合計が小さくなるように、配置を決定するようにしている。これにより、関連性の高い記事が近くの位置にあるように配置されることになる。   Therefore, in this embodiment, the arrangement is determined so that the total attractive force of the virtual springs when the virtual article area is arranged becomes small. As a result, articles with high relevance are arranged so as to be in nearby positions.

次に、CPU34は、最も重要度の高い記事に対応する仮想記事領域を、仮想平面の右上に配置する(ステップS73、図19A参照)。ここでは、記事K1の重要度が最も高いものとして説明を進める。図19Aに示すように、記事K1に対応する仮想記事領域が仮想平面の右上に配置されることになる。なお、仮想平面は、記事を表示するための領域に対応して設定した仮想的な平面である。記事表示領域(端末装置のディスプレイの大きさ)の大きさ(縦・横)に比例して、仮想平面の大きさ(縦・横)も変化するように設定している。なお、この実施形態では、重要度の最も高い記事は、最も注目度の高い右上の場所に固定するものとしている。   Next, the CPU 34 arranges the virtual article region corresponding to the article with the highest importance at the upper right of the virtual plane (see step S73, FIG. 19A). Here, the description will be made assuming that the importance of the article K1 is the highest. As shown in FIG. 19A, the virtual article region corresponding to the article K1 is arranged at the upper right of the virtual plane. The virtual plane is a virtual plane set corresponding to the area for displaying the article. The size (vertical / horizontal) of the virtual plane is set to change in proportion to the size (vertical / horizontal) of the article display area (display size of the terminal device). In this embodiment, the article with the highest importance is fixed at the upper right place with the highest attention.

次に、図18のテーブル中から、最も関連度の高い記事のペアを読み出す(ステップS74)。ここでは、記事K1と記事K5のペアが選択される。CPU34は、選択した記事ペアの少なくとも一方が、すでに、仮想平面に配置されているか否かを判断する(ステップS75)。ここでは、記事K1が既に配置されているので、ステップS76に進む。ステップS76においては、取得した記事ペアを仮想平面に配置する。なお、配置の際に、新たに配置される記事については、ペアの記事と接するように、しかも可能な限り右上に近い位置となるように配置する(この実施形態では、上よりも右側であることを優先する)。   Next, the pair of articles having the highest degree of association is read out from the table of FIG. 18 (step S74). Here, a pair of article K1 and article K5 is selected. The CPU 34 determines whether at least one of the selected article pairs has already been arranged on the virtual plane (step S75). Here, since the article K1 is already arranged, the process proceeds to step S76. In step S76, the acquired article pair is arranged on a virtual plane. In the case of placement, the newly placed article is placed so as to be in contact with the paired article and as close to the upper right as possible (in this embodiment, it is on the right side from the top). Priority.)

ここでは、図19Bに示すように、仮想バネがかけられた記事K1と記事K5が配置されることになる。なお、記事K1は既に配置済みであるから改めて配置はしない。なお、配置の際には、互いの仮想記事領域は重なり合わないようにする。   Here, as shown in FIG. 19B, an article K1 and an article K5 to which a virtual spring is applied are arranged. Since article K1 has already been arranged, it will not be arranged again. It should be noted that the virtual article areas are not overlapped when arranged.

上記のようにして記事ペアを配置すると、CPU34は、当該記事ペアを図18のテーブルから削除する(ステップS77)。次に、CPU34は、別置きされた記事が、仮想平面上にあるかどうかを判断する(ステップS78)。ここでは、別置きした記事はないので、ステップS80に進む。   When the article pair is arranged as described above, the CPU 34 deletes the article pair from the table of FIG. 18 (step S77). Next, the CPU 34 determines whether or not the separately placed article is on the virtual plane (step S78). Here, since there is no separately placed article, the process proceeds to step S80.

ステップS80において、CPU34は、図18のテーブルに記事ペアが残っているかどうかを判断する。ここでは、まだ記事ペアが残っているので、ステップS73に戻る。   In step S80, the CPU 34 determines whether an article pair remains in the table of FIG. Here, since the article pair still remains, the process returns to step S73.

ステップS73においては、図18のテーブルに残った記事ペアのうち、最も関連度の高いものを選択する。ここでは、記事ペアK3、K5が選択される。この記事ペアK3、K5のうち記事K5が既に仮想平面に配置されているので、この記事ペアを、仮想平面に配置する(ステップS75、S76)。ここでは、図20Aのように、記事K5との間に仮想バネがかけられた記事K3が配置されることになる。   In step S73, the article pair having the highest degree of association is selected from the article pairs remaining in the table of FIG. Here, the article pair K3, K5 is selected. Of the article pairs K3 and K5, the article K5 is already arranged on the virtual plane, so this article pair is arranged on the virtual plane (steps S75 and S76). Here, as shown in FIG. 20A, an article K3 with a virtual spring is placed between the article K5 and the article K5.

上記の処理を終えると、次に、CPU34は、図18のテーブルから記事ペアK1、K3を読み出して配置する。ここでは、図20Aに示すように、既に記事K1および記事K3がともに配置されているので、記事K1と記事K3との間に仮想バネをかける処理を行うことになる。   When the above processing is completed, the CPU 34 reads and arranges the article pairs K1 and K3 from the table of FIG. Here, as shown in FIG. 20A, since the article K1 and the article K3 are already arranged, a process of applying a virtual spring between the article K1 and the article K3 is performed.

上記の処理を繰り返すことにより、すべての記事K1〜K5を仮想平面に配置する。これにより、図20Bに示すように、互いに仮想バネのかけられた記事K1〜K5が配置されることになる。   By repeating the above processing, all articles K1 to K5 are arranged on a virtual plane. Thereby, as shown in FIG. 20B, articles K1 to K5 with virtual springs applied to each other are arranged.

なお、上記にて説明した図18のテーブルとは異なるテーブルにて処理を行った場合の処理について、以下にいくつかの例を示す。たとえば、図21Aに示すように、記事K1とK5のペア、記事K1とK2のペア、記事K2とK3のペアを配置したものとする。この配置状態において、テーブルから記事K2とK5のペアを読み出した場合には、K3を矢印の方向に移動させるとともに、K2をK3に接するように矢印の方向に回転させる。このようにして、図21Bのように配置する。   Note that some examples of processing when processing is performed using a table different from the table of FIG. 18 described above are shown below. For example, as shown in FIG. 21A, it is assumed that a pair of articles K1 and K5, a pair of articles K1 and K2, and a pair of articles K2 and K3 are arranged. In this arrangement state, when a pair of articles K2 and K5 is read from the table, K3 is moved in the direction of the arrow, and K2 is rotated in the direction of the arrow so as to contact K3. Thus, it arrange | positions like FIG. 21B.

また、図22Aに示すように、記事K3を配置しようとする際に、記事K3が仮想空間からはみ出る場合、はみ出ない位置を探し出して配置する。あるいは、図22Bに示すように、できるだけはみ出る面積が小さくなるような位置を探し出して配置する。   As shown in FIG. 22A, when the article K3 protrudes from the virtual space when the article K3 is to be arranged, a position that does not protrude is found and arranged. Alternatively, as shown in FIG. 22B, a position where the protruding area is as small as possible is found and arranged.

また、テーブルから読み出した記事ペアのいずれもが、仮想空間に配置されていない場合には、当該記事ペアを別置きしておく(ステップS75、S90、S91)。たとえば、図23Aに示すように、記事K1とK5が配置されている状態で、記事K3とK4のペアをテーブルから読み出したとする。この場合には、記事K3とK4のペアを、図23Aに示すように別置きしておく。   If none of the article pairs read from the table is arranged in the virtual space, the article pair is placed separately (steps S75, S90, S91). For example, as shown in FIG. 23A, it is assumed that a pair of articles K3 and K4 is read from the table in a state where articles K1 and K5 are arranged. In this case, a pair of articles K3 and K4 is placed separately as shown in FIG. 23A.

別置きした記事ペアのいずれかが、仮想空間内に配置されれば、当該別置きしておいた記事ペアを仮想空間に配置する(ステップS78、S79)。たとえば、図23Aの状態において、テーブルから記事ペアK1、K4が読み出され、記事K4が配置されたとする(図23B参照)。いま、記事K4は記事K3とともに別置きされているので、これらペアを仮想空間に配置する。配置の仕方は、通常のペアを配置する場合と同様である。   If any of the separately placed article pairs is placed in the virtual space, the separately placed article pair is placed in the virtual space (steps S78 and S79). For example, in the state of FIG. 23A, article pairs K1 and K4 are read from the table and article K4 is arranged (see FIG. 23B). Since the article K4 is now placed separately with the article K3, these pairs are arranged in the virtual space. The arrangement method is the same as in the case of arranging a normal pair.

以下、図18のテーブルに従った説明に戻る。図18のテーブルに記事ペアが残っていなければ、CPU34は、ステップS80からステップS81に進む。ステップS81においては、別置きされた記事が残っているかどうかを判断する。別置きされた記事が残っていれば、それら全てを、仮想平面において、他の記事と重複せず、しかもできるだけ右上に近くなるように配置する(ステップS82)。   Hereinafter, the description returns to the table of FIG. If no article pair remains in the table of FIG. 18, the CPU 34 proceeds from step S80 to step S81. In step S81, it is determined whether or not a separately placed article remains. If there are any articles left separately, they are all arranged so as not to overlap with other articles on the virtual plane and as close to the upper right as possible (step S82).

以上のようにして、全ての記事の仮想記事領域について配置を終えると、円形の記事領域を矩形または矩形の組合せからなる記事領域に変形し、記事領域を決定する(ステップS83)。矩形への変形は、中心を変えずに、同じ面積を有する正方形に置き換える(所定比率の矩形を予め定義しておいてもよい)。たとえば、図24Aに示す場合であれば、図24Bに示すように変形されることになる。   As described above, when the arrangement of the virtual article areas of all articles is completed, the circular article area is transformed into an article area consisting of a rectangle or a combination of rectangles, and the article area is determined (step S83). The transformation into a rectangle is replaced with a square having the same area without changing the center (a rectangle with a predetermined ratio may be defined in advance). For example, in the case shown in FIG. 24A, it is deformed as shown in FIG. 24B.

続いて、CPU34は、記事領域の重複部分を回避し、また、記事領域間の隙間を埋めるように、各記事領域を変形する。このようにして、図25に示すような記事領域を得ることができる。
Subsequently, the CPU 34 deforms each article region so as to avoid an overlapping portion of the article regions and to fill a gap between the article regions. In this way, an article region as shown in FIG. 25 can be obtained.

4.その他の実施形態
(1)上記実施形態では、2つの記事の重要単語の組合せにより検索を行い、そのヒット件数の合計によって関連度を算出するようにしている。しかしながら、次のようにして、関連度を算出するようにしてもよい。一方の記事の重要単語が、他方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これで、一方の記事から、他方の記事への関連度を得ることができる。次に、他方の記事の重要単語が、一方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これにより、他方の記事から、一方の記事への関連度を得ることができる。最後に、一方の記事から他方の記事への関連度と、他方の記事から一方の記事への関連度を合計して、関連度を得る。
4). Other embodiments
(1) In the above embodiment, a search is performed using a combination of important words of two articles, and the relevance is calculated based on the total number of hits. However, the association degree may be calculated as follows. The number of important words in one article is calculated in the other article, and this is performed for all the important words and totaled. Thus, the degree of association from one article to the other article can be obtained. Next, how many important words of the other article are included in one article is calculated, and this is performed for all the important words and totaled. Thereby, the degree of relevance to one article can be obtained from the other article. Finally, the degree of association from one article to the other article and the degree of association from the other article to one article are summed to obtain the degree of association.

(2)上記実施形態では、バネ定数の大きい(すなわち関連度の高い)記事ペアから順に、仮想空間に配置するようにしている。このようにすることで、バネの引力が小さくなるような配置を目指している。 (2) In the above embodiment, the article pairs are arranged in the virtual space in order from the article pair having the larger spring constant (that is, the relevance degree). By doing in this way, it aims at arrangement | positioning that the attractive force of a spring becomes small.

しかし、仮想記事領域を配置した状態において、各仮想バネに働く引力を計算し、仮想バネに働く引力の合計が小さくなるように、仮想記事領域を入れ替えるようにして、配置を決定するようにしてもよい。   However, in the state where the virtual article area is arranged, the attractive force acting on each virtual spring is calculated, and the virtual article area is changed so that the total of the attractive forces acting on the virtual spring becomes small, and the arrangement is determined. Also good.

たとえば、最も重要度の高い記事K1の仮想記事領域を右上に配置した後、他の記事の仮想記事領域をランダムに配置する。この状態を示すのが、図27である。   For example, after the virtual article area of the article K1 having the highest importance is arranged on the upper right, the virtual article areas of other articles are arranged randomly. This state is shown in FIG.

ここで、CPU34は、各記事間のバネ定数に基づき、各バネに働く引力を合計する。つまり、下式にて力の合計Fを算出する。   Here, the CPU 34 sums up the attractive forces acting on each spring based on the spring constant between the articles. That is, the total force F is calculated by the following equation.

F=F1,2+F1,3+F1,4+F1,5+F1,6+F2,3+F2,4+F2,5+F2,6+F3,4+F3,5+F3,6+F4,5+F4,6+F5,6
ここで、Fi,jは、記事KiとKjに働く引力であり、記事KiとKjとの間にかけられた仮想バネのバネ定数pi,jと、記事KiとKjの互いの外周面がどれだけ離れているかを示す距離xi,jとの積によって求められる(図26B参照)。
F = F1,2 + F1,3 + F1,4 + F1,5 + F1,6 + F2,3 + F2,4 + F2,5 + F2,6 + F3,4 + F3,5 + F3,6 + F4,5 + F4,6 + F5,6
Here, Fi, j is the attractive force acting on the articles Ki and Kj, and how much the spring constant pi, j of the virtual spring applied between the articles Ki and Kj and the outer peripheral surfaces of the articles Ki and Kj. It is obtained by the product of the distances xi, j indicating whether they are separated (see FIG. 26B).

次に、CPU34は、上記のF1,2、F1,3、F1,4、F1,5、F1,6、F2,3、F2,4、F2,5、F2,6、F3,4、F3,5、F3,6、F4,5、F4,6、F5,6のうち、最も大きいものを選択する。たとえば、F2,5が最も大きいとする。つまり、記事K2と記事K5の間に最も大きな力が働いていることがわかる。したがって、記事K2と記事K5を近づけるように配置替えすることで、合計の力Fを小さくできる可能性があることになる。つまり、より関連性の高い記事を近くに配置できる可能性があることになる。   Next, the CPU 34 performs the above-described F1,2, F1,3, F1,4, F1,5, F1,6, F2,3, F2,4, F2,5, F2,6, F3,4, F3, 5, F3,6, F4,5, F4,6, F5,6 The largest one is selected. For example, assume that F2,5 is the largest. That is, it can be seen that the greatest force is working between the article K2 and the article K5. Therefore, the total force F may be reduced by rearranging the articles K2 and K5 so as to be close to each other. In other words, there is a possibility that more relevant articles can be placed nearby.

CPU34は、記事K2と記事K5の双方に対して、0より大きい力で引き合う記事を探し出す。たとえば、記事K6は記事K2と接しており引力は0である、同様に、記事K3は記事K5と接しており引力は0である。したがって、記事K2、K5のいずれとも接していない記事K4だけがこの条件に合致するものとして選択されることになる。なお、固定配置される記事K1は、ここでは対象としない。   The CPU 34 searches for an article that attracts the article K2 and the article K5 with a force greater than zero. For example, article K6 is in contact with article K2 and has an attractive force of 0. Similarly, article K3 is in contact with article K5 and has an attractive force of 0. Therefore, only the article K4 that is not in contact with any of the articles K2 and K5 is selected as satisfying this condition. The article K1 that is fixedly arranged is not a subject here.

CPU34は、最も大きな力が働いている記事K2、K5と、選択した記事K4とを入れ替えて、合計の力Fを再計算する。つまり、選択した記事K4と記事K2の場所を入れ替える。そして、合計の力Fを再計算する。同様にして、記事K4と記事K5の場所を入れ替え、合計の力Fを再計算する。   The CPU 34 recalculates the total force F by replacing the articles K2 and K5 where the greatest force is working with the selected article K4. That is, the location of the selected article K4 and article K2 is switched. Then, the total force F is recalculated. Similarly, the places of the article K4 and the article K5 are exchanged, and the total force F is recalculated.

そして、元の配置、記事K4とK2を入れ替えた配置、記事K4とK5を入れ替えた配置のうち、力Fが最も小さい配置を選択する。   Then, among the original arrangement, the arrangement in which the articles K4 and K2 are exchanged, and the arrangement in which the articles K4 and K5 are exchanged, an arrangement having the smallest force F is selected.

最も力Fが小さい配置が元の配置であれば、CPU34は、元の配置が好ましい配置であるとして決定する。記事K4とK2を入れ替えた配置または記事K4とK5を入れ替えた配置が最も力Fが小さい配置であれば、当該配置において、最も大きな引力の働く記事間の組合せを見いだし、上記の処理を繰り返す。このようにして、ある程度、力Fが小さくなる配置を決定することができる。   If the arrangement with the smallest force F is the original arrangement, the CPU 34 determines that the original arrangement is the preferred arrangement. If the arrangement in which the articles K4 and K2 are exchanged or the arrangement in which the articles K4 and K5 are exchanged is the arrangement where the force F is the smallest, the combination of the articles with the greatest attraction is found in the arrangement, and the above processing is repeated. In this way, an arrangement where the force F is reduced to some extent can be determined.

上記実施形態では、最も大きな力が働いている記事K2と記事K5の双方に対して、0より大きい力で引き合う記事を探し出し、当該記事の仮想記事領域と入れ替えを行うようにしている。しかし、図27において、記事K6、K3も入れ替えを行う対象として選択するようにしてもよい。記事K6はK2に接しているがK5に接しておらず、記事K3はK5に接しているがK2に接しておらず、しかも、K6とK3は接していないからである。つまり、K2、K3、K6、K5の経路にて力が0ではない状態の仮想バネにてつながっているからである。   In the above embodiment, for both the article K2 and the article K5 where the greatest force is working, an article that attracts with a force larger than 0 is searched and replaced with the virtual article region of the article. However, in FIG. 27, articles K6 and K3 may also be selected as objects to be exchanged. This is because article K6 is in contact with K2 but not in contact with K5, article K3 is in contact with K5 but not with K2, and K6 and K3 are not in contact with each other. In other words, it is connected by a virtual spring in a state where the force is not 0 in the paths K2, K3, K6, and K5.

この場合、CPU34は、記事K3の仮想記事領域と記事K2の仮想記事領域を入れ替え、記事K6の仮想記事領域と記事K5の仮想記事領域とを入れ替えて、合計力の変化を見ることになる。   In this case, the CPU 34 exchanges the virtual article area of the article K3 and the virtual article area of the article K2, and exchanges the virtual article area of the article K6 and the virtual article area of the article K5 to see the change in the total power.

また、上記実施形態では、ランダムに仮想記事領域を配置するようにしている。しかし、図15、図16に示す処理にて仮想記事領域を配置した後、上記の入れ替えを行うようにしてもよい。   In the above embodiment, virtual article areas are randomly arranged. However, the above-described replacement may be performed after the virtual article region is arranged by the processing shown in FIGS.

さらに、上記実施形態では、入れ替えによって力Fの小さくなる配置を探し出している。しかし、最も重要度の大きい記事の仮想記事領域を固定配置した後、他の仮想記事領域をかなり離れた位置に仮配置し、仮想バネの力によって自然に収まる位置に決定するようにしてもよい。この場合、他の仮想記事領域(固定記事領域以外の仮想記事領域)は、移動中においての重なり合いを許容するようにする。ただし、固定配置された仮想記事領域と接した瞬間に、他の仮想記事領域との重なり合いを禁止するようにする。   Furthermore, in the said embodiment, the arrangement | positioning where force F becomes small by replacement is searched. However, after the virtual article area of the article having the highest importance is fixedly arranged, other virtual article areas are temporarily arranged at positions far away from each other, and may be determined to be naturally fitted by the force of the virtual spring. . In this case, other virtual article areas (virtual article areas other than the fixed article area) are allowed to overlap during movement. However, the overlap with other virtual article areas is prohibited at the moment of contact with the fixedly arranged virtual article area.

上記では、ステップS24、S40、S41において、仮想空間に配置されていない記事ペアの別置きの方法を説明した。しかし、当該記事ペアを別置きせずに、既に配置されている記事群に接するように配置し(この段階では、当該記事ペアと既に配置されている記事群との間には仮想バネを設けない)、最後に上記の入れ替えによって仮想バネに働く引力の合計が小さくなるようにしてもよい。   In the above description, the method of separately placing article pairs that are not arranged in the virtual space has been described in steps S24, S40, and S41. However, instead of placing the article pair separately, place the article pair so that it touches the already placed article group (at this stage, provide a virtual spring between the article pair and the already placed article group. Finally, the total attractive force acting on the virtual spring may be reduced by the above replacement.

なお、上記では、バネ定数kによる仮想バネの引力をF=k×xとしたが、Fがkおよびxの単調増加関数となるようにすればよい。たとえば、F=k×log(x)とすれば、距離の影響をより小さく評価することができる。   In the above description, the attractive force of the virtual spring by the spring constant k is F = k × x, but it is sufficient that F is a monotonically increasing function of k and x. For example, if F = k × log (x), the influence of distance can be evaluated smaller.

CPU34が、このようなシミュレーションを行うことで、よりバネ定数の大きい仮想記事領域が早く固定配置された仮想記事領域に接することになり、適切な配置を実現することができる。   By performing such a simulation, the CPU 34 comes into contact with a virtual article region having a larger spring constant and fixedly arranged earlier, and appropriate arrangement can be realized.

(3)上記実施形態では、右上に記事領域を固定的に配置している。これは、縦書きの記事において、右上が最も注目度が高いからである。横書きの場合には、左上に配置するようにしても良い。 (3) In the above embodiment, the article area is fixedly arranged at the upper right. This is because the attention level is the highest in the vertically written article. In the case of horizontal writing, it may be arranged at the upper left.

(4)上記実施形態では、仮想記事領域として円を用いたが、矩形、三角、六角などの他の図形を用いるようにしても良い。 (4) In the above embodiment, a circle is used as the virtual article area. However, other figures such as a rectangle, a triangle, and a hexagon may be used.

(5)上記実施形態では、固定的に配置された仮想記事領域を設けている。しかし、全ての仮想記事領域を移動可能にしてもよい。
(5) In the above embodiment, a fixedly arranged virtual article region is provided. However, all the virtual article areas may be movable.

5.要約文生成プログラム
上記実施形態では、記事の重要度・関連度に応じた記事領域の配置について説明した。このようにして配置した各記事領域には、当該記事を表示することになる。ただし、記事領域に表示できる文字数(文字フォントの大きさと記事領域の大きさによって決まる)よりも、記事の文字数が多い場合には、記事の内容を全て表示することができない。そこで、記事領域に表示できる文字数内の要約を作成し、これを記事領域に表示する必要が生じる。
5. Summary sentence generation program In the above embodiment, the arrangement of article areas according to the importance / relevance of articles has been described. The article is displayed in each article area arranged in this way. However, if the number of characters in the article is larger than the number of characters that can be displayed in the article area (determined by the size of the character font and the size of the article area), the entire contents of the article cannot be displayed. Therefore, it is necessary to create a summary within the number of characters that can be displayed in the article area and display it in the article area.

以下、要約文生成プログラムのフローチャートを、図28、図29に示す。   The summary sentence generation program flowcharts are shown in FIGS.

(1)文の抽出
CPU34は、ステップS101において、ハードディスク40に記録された記事の文章データから、文を抽出する(ステップS101)。この実施形態では、句点(「。」や「.」)に基づいて、文を抽出するようにしている。すなわち、句点が見いだされるまでを一つの文として抽出する。
(1) Sentence Extraction In step S101, the CPU 34 extracts a sentence from article text data recorded on the hard disk 40 (step S101). In this embodiment, a sentence is extracted based on a punctuation mark (“.” Or “.”). That is, a sentence until a punctuation is found is extracted as one sentence.

たとえば、図30に示すような文章データ(記事)であれば、図31に示すように、文番号「1」〜「6」までの6つの文が抽出されることになる。CPU34は、このようにして抽出した文を、順番を示す文番号とともにハードディスク40に記録する。この際、CPU34は、各文の文字数を併せて記録する。   For example, in the case of sentence data (article) as shown in FIG. 30, as shown in FIG. 31, six sentences with sentence numbers “1” to “6” are extracted. The CPU 34 records the sentence extracted in this way on the hard disk 40 together with the sentence number indicating the order. At this time, the CPU 34 also records the number of characters of each sentence.

(2)形態素解析
次に、CPU34は、文章データに含まれる全ての文を対象として、形態素解析を行う(ステップS102)。形態素解析処理の詳細は、図5に示すものと同様である。形態素解析の結果を、図7に示す。
(2) Morphological analysis Next, the CPU 34 performs morphological analysis on all sentences included in the sentence data (step S102). Details of the morphological analysis processing are the same as those shown in FIG. The result of morphological analysis is shown in FIG.

(3)TF値算出
次に、CPU34は、上記にて抽出した単語(この実施形態では名詞を含む単語のみを対象とする)について、TF(Term Frequency)値を算出する(ステップS103)。つまり、図7のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、TF値を算出する。
(3) TF Value Calculation Next, the CPU 34 calculates a TF (Term Frequency) value for the word extracted above (in this embodiment, only words including nouns are targeted) (step S103). That is, the TF value is calculated for a word whose part of speech recorded in the table of FIG. 7 is a noun and a word including the noun as a part of speech.

ここで、TF値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。   Here, the TF value is a value obtained by dividing the number of times the word appears in the sentence by the total number of words in the sentence.

TF=単語の出現回数/各単語の出現回数の合計
図8aに、各単語について算出したTF値を示す。CPU34は、算出したTF値をハードディスク40に記録する。
TF = number of appearances of words / total number of appearances of each word FIG. 8a shows the TF value calculated for each word. The CPU 34 records the calculated TF value on the hard disk 40.

この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。   In this embodiment, by obtaining the appearance frequency of each word in the sentence, how much each word is emphasized in the sentence is calculated.

(4)IDF値算出
次に、CPU34は、各単語についてIDF(Inverse Document Frequency)値を算出する(ステップS104)。IDF算出処理の詳細は、図9に示すものと同様である。CPU34は、算出したIDF値を、各単語に対応づけてハードディスク40に記録する(図8a参照)。
(4) IDF Value Calculation Next, the CPU 34 calculates an IDF (Inverse Document Frequency) value for each word (step S104). The details of the IDF calculation process are the same as those shown in FIG. The CPU 34 records the calculated IDF value in the hard disk 40 in association with each word (see FIG. 8a).

(5)TF−IDF値算出
続いて、CPU34は、各単語につき、算出したTF値とIDF値に基づいて、TF−IDF値を計算する(ステップS105)。この実施形態では、TF値とIDF値との積を算出することにより、TF−IDF値を算出するようにしている。
(5) TF-IDF value calculation Subsequently, the CPU 34 calculates a TF-IDF value based on the calculated TF value and IDF value for each word (step S105). In this embodiment, the TF-IDF value is calculated by calculating the product of the TF value and the IDF value.

(6)Hot係数算出
続いて、CPU34は、Hot係数を算出する(ステップS106)。Hot係数算出処理の詳細は、図10に示すものと同様である。CPU34は、算出したHot係数を、対象単語に対応づけて記録する(図8a参照)。
(6) Hot coefficient calculation Subsequently, the CPU 34 calculates a Hot coefficient (step S106). The details of the Hot coefficient calculation process are the same as those shown in FIG. The CPU 34 records the calculated Hot coefficient in association with the target word (see FIG. 8a).

(7)重要度の算出
CPU34は、各単語につき、TF−IDF値にHot係数を乗じて、重要度を算出する(ステップS107)。CPU34は、このようにして算出した重要度を、対象単語に対応づけて記録する(図8a参照)。
(7) Calculation of Importance The CPU 34 calculates the importance for each word by multiplying the TF-IDF value by the Hot coefficient (step S107). The CPU 34 records the importance calculated in this way in association with the target word (see FIG. 8a).

次に、CPU34は、各単語の重要度に基づいて重要単語を決定する(ステップS108)。この実施形態では、単語の重要度の平均値を算出し、この平均値を超える重要度を有する単語を重要単語として抽出している。たとえば、図8aに示す場合であれば、単語の重要度の平均値は11.40135438である。したがって、CPU34は、この平均値を超える重要度を有する単語「電子書籍」「図書館」「書籍」・・・「利用価値」を重要単語として選択することになる。   Next, the CPU 34 determines an important word based on the importance of each word (step S108). In this embodiment, an average value of importance levels of words is calculated, and words having importance levels exceeding the average value are extracted as important words. For example, in the case shown in FIG. 8a, the average word importance is 11.40135438. Therefore, the CPU 34 selects the words “electronic book”, “library”, “book”,... “Use value” having importance exceeding the average value as important words.

次に、CPU34は、各文のうち重要単語が含まれる文について重要度を算出する。重要度は、当該文に含まれる各単語の重要度を合計することによって算出する(ステップS109)。たとえば、図31に示す文章の第1文「平素は、・・・申し上げます。」には、重要単語が含まれていないので、第1文についての重要度は算出しない。第2文「当社は従来より・・・参りました。」には、重要単語「当社」「図書館」「書籍」がふくまれているので重要度を算出する。CPU34は、各単語の重要度を図8aを参照して取得し、これを合計して重要度57.83187を得る。   Next, the CPU 34 calculates an importance level for a sentence including an important word among the sentences. The importance is calculated by summing the importance of each word included in the sentence (step S109). For example, since the first sentence of the sentence shown in FIG. 31 “Plain is plain ...” does not include an important word, the importance of the first sentence is not calculated. In the second sentence “Our company has been here ...”, the important words “Our company”, “Library” and “Book” are included, so the importance is calculated. The CPU 34 acquires the importance of each word with reference to FIG. 8a and adds them together to obtain the importance 57.83187.

CPU34は、算出した各文の重要度を、各文に対応づけてハードディスク40に記録する(図31参照)。   The CPU 34 records the calculated importance of each sentence on the hard disk 40 in association with each sentence (see FIG. 31).

(8)要約文の生成
次に、CPU34は、算出した各文の重要度に基づき、最も重要度の高い文を抽出する(ステップS110)ここでは、図31に示す第4文の重要度が最も高いので、第4文が選択される。CPU34は、選択した文の文字数の合計が、予め定められた指定文字数を超えているかどうかを判断する(ステップS111)。ここでは、記事領域に表示できる文字数が指定文字数となる。ここでは、指定文字数が、250文字であるとして説明を進める。
(8) Generation of Summary Sentence Next, the CPU 34 extracts the sentence with the highest importance based on the calculated importance of each sentence (step S110). Here, the importance of the fourth sentence shown in FIG. Since it is the highest, the fourth sentence is selected. The CPU 34 determines whether or not the total number of characters of the selected sentence exceeds a predetermined number of designated characters (step S111). Here, the number of characters that can be displayed in the article area is the designated number of characters. Here, the description proceeds assuming that the designated number of characters is 250 characters.

第4文の文字数は、62文字である(図31参照)。したがって、指定文字数である250文字を超えていないので、ステップS12に進む。ステップS12では、次に重要度の高い文を抽出する。ここでは、第5文が選択されることになる。第5分の文字数は97文字である。したがって、選択された文の合計文字数は、62文字と97文字を合計して、160文字となる。よって、指定文字数である250文字を超えていないので、ステップS111からステップS112に進む。   The number of characters in the fourth sentence is 62 characters (see FIG. 31). Therefore, since the designated number of characters does not exceed 250, the process proceeds to step S12. In step S12, the next most important sentence is extracted. Here, the fifth sentence is selected. The fifth character number is 97 characters. Therefore, the total number of characters of the selected sentence is 160 characters, which is the sum of 62 characters and 97 characters. Therefore, since the designated number of characters does not exceed 250, the process proceeds from step S111 to step S112.

ステップS112では、さらに次に重要度の高い文を抽出する。このような処理を、選択された文の合計文字数が指定文字数250文字を超えるまで繰り返す。ここでは、第4文(62文字)、第5文(97文字)、第3文(74文字)、第2文(56文字)を抽出した時点で、合計文字数が289文字となって指定文字数を超える。   In step S112, the next most important sentence is extracted. Such processing is repeated until the total number of characters of the selected sentence exceeds the designated number of characters 250. Here, when the fourth sentence (62 characters), the fifth sentence (97 characters), the third sentence (74 characters), and the second sentence (56 characters) are extracted, the total number of characters becomes 289 characters and the designated number of characters. Over.

指定文字数を超えると、CPU34は、最後に抽出した文を抽出文から外す(ステップS113)。ここでは、第2文が最後に抽出した文であるから、第2文を抽出したものから外す。その結果、図32に示すように、第4文、第5文、第3文が抽出されることになる。   When the specified number of characters is exceeded, the CPU 34 removes the last extracted sentence from the extracted sentence (step S113). Here, since the 2nd sentence is the sentence extracted last, it removes from what extracted the 2nd sentence. As a result, as shown in FIG. 32, the fourth sentence, the fifth sentence, and the third sentence are extracted.

次に、CPU34は、抽出した文を、元の文章における順番(つまり文番号の若い順)に従って並び替える(ステップS114)。これにより、図33に示すような順番の抽出文を得ることができる。   Next, the CPU 34 rearranges the extracted sentences according to the order in the original sentence (that is, the sentence number is in ascending order) (step S114). Thereby, the extracted sentences in the order as shown in FIG. 33 can be obtained.

CPU34は、このようにして並び替えた抽出文を要約として出力する(ステップS115)。ここでは、図33に示す「書籍の電子化が・・・繋げたいと考えております。」という要約を、対応する表示領域に出力する。   The CPU 34 outputs the extracted sentences rearranged in this way as a summary (step S115). Here, the summary “The digitization of the book… I want to connect” shown in FIG. 33 is output to the corresponding display area.

以上の処理を、全ての表示領域について行う。これにより、各表示領域には、対応する記事の要約文が表示される。なお、CPU34は、要約文とともに、記事全文へのリンク情報を表示するようにしている。
The above processing is performed for all display areas. Thereby, the summary sentence of the corresponding article is displayed in each display area. The CPU 34 displays the link information to the full article along with the summary sentence.

6.その他の実施形態
(1)上記実施形態では、TF値(強調度)、IDF値(希少度)、Hot係数(注目度)に基づいて単語の重要度を算出するようにしている。しかしながら、これらのうちのいずれか一つを用いて重要度を算出したり、これらのうちのいずれか二つを組み合わせて重要度を算出するようにしてもよい。
6). Other embodiments
(1) In the above embodiment, the importance level of a word is calculated based on the TF value (enhancement level), IDF value (rareness level), and Hot coefficient (attention level). However, the importance may be calculated using any one of these, or the importance may be calculated by combining any two of these.

(2)上記実施形態では、当該文章における単語の出現回数に基づいて単語の強調度を算出するようにしている。しかし、文章中における単語の出現位置に基づいて、単語の強調度を判断するようにしてもよい。たとえば、文の後ろの方に出てくる単語の方が強調度を高くするようにしてもよい。さらに。出現回数と出現位置とを組み合わせて強調度を算出するようにしてもよい。 (2) In the above embodiment, the word emphasis degree is calculated based on the number of appearances of the word in the sentence. However, the degree of word emphasis may be determined based on the appearance position of the word in the sentence. For example, the word appearing at the back of the sentence may be enhanced. further. The enhancement degree may be calculated by combining the number of appearances and the appearance position.

(3)上記実施形態では、検索サイトにおける当該単語のヒット数と、検索対象の全ページ数との比率に基づいて希少度(IDF値)を算出するようにしている。しかし、辞書や百科事典(ウエブ上にあるものローカルにあるものを問わない)などにおいて当該単語が何回使用されているか(見出し項目だけでなく内容中に用いられている場合も含む回数)に基づいて、当該単語の希少度を算出するようにしてもよい。 (3) In the above embodiment, the rarity (IDF value) is calculated based on the ratio between the number of hits of the word on the search site and the total number of pages to be searched. However, how many times the word is used in dictionaries and encyclopedias (regardless of whether they are on the web or local), including how many times the word is used in the content Based on this, the degree of rarity of the word may be calculated.

(4)上記実施形態では、ウエブ上の辞書の更新日の平均値と現在日の差に基づいて、現在の注目度(Hot係数)を算出するようにしている。しかしながら、最新の更新日との差に基づいて、現在の注目度を算出するようにしてもよい。あるいは、所定期間内に更新が行われた回数を算出し、これに基づいて現在の注目度を算出するようにしてもよい(更新回数が多いほど、注目度が大きい)。 (4) In the above embodiment, the current attention level (Hot coefficient) is calculated based on the difference between the average value of the updated dictionaries on the web and the current date. However, the current attention level may be calculated based on the difference from the latest update date. Alternatively, the number of updates performed within a predetermined period may be calculated, and the current attention level may be calculated based on this (the higher the update count, the higher the attention level).

(5)上記実施形態では、各単語の重要度の平均値をしきい値として重要単語を抽出するようにしている。しかし、標準偏差、分散なども考慮して重要単語を抽出するようにしてもよい。 (5) In the above embodiment, important words are extracted using the average value of the importance of each word as a threshold value. However, important words may be extracted in consideration of standard deviation and variance.

(6)上記実施形態では、重要単語を含む文についてのみ重要度を算出するようにしている。しかし、全ての文について重要度を算出するようにしてもよい。 (6) In the above embodiment, the importance is calculated only for the sentence including the important word. However, importance may be calculated for all sentences.

(7)上記実施形態では、指定文字数を超えない範囲で、文を選択するようにしている。しかし、指定文字数と合計文字数の差の絶対値が最も小さくなるように文を選択するようにしてもよい。 (7) In the above embodiment, sentences are selected within a range not exceeding the specified number of characters. However, the sentence may be selected so that the absolute value of the difference between the specified number of characters and the total number of characters is minimized.

(8)上記実施形態では、指定文字数に基づいて文を選択するようにしている。しかし、文の合計数、行の合計数、文の合計データ量などに基づいて文を選択するようにしてもよい。 (8) In the above embodiment, a sentence is selected based on the designated number of characters. However, the sentence may be selected based on the total number of sentences, the total number of lines, the total data amount of the sentences, and the like.

(9)上記実施形態では、指定文字数などの文の選択基準は予め定められているものとしている。しかし、対象とする文章の文字数などに応じて、指定文字数などを可変にするようにしてもよい(たとえば、文章の文字数の半分を指定文字数とするなど)。これにより、文章の長さに対応した長さの要約文を得ることができる。 (9) In the above embodiment, it is assumed that sentence selection criteria such as the number of designated characters are predetermined. However, the number of designated characters may be made variable according to the number of characters in the target sentence (for example, half the number of characters in the sentence is designated as the designated number of characters). Thereby, a summary sentence having a length corresponding to the length of the sentence can be obtained.

(10)上記実施形態では、端末装置側において要約文作成処理を行っている。しかしながら、サーバ装置側において、要約文作成処理を行うようにしてもよい。 (10) In the above embodiment, the summary sentence creation process is performed on the terminal device side. However, the summary sentence creation process may be performed on the server device side.

(11)上記実施形態では、句点に基づいて文章中から「文」を抽出するようにしている。しかし、見出しなどのように句点のない文もある。そこで、見出しであると判断した部分(他の部分よりフォントが大きい、見出しであるとの属性が付与されている等により判断する)については、全体を一文であると判断するようにしてもよい。 (11) In the above embodiment, “sentence” is extracted from the sentence based on the punctuation mark. However, some sentences, such as headings, have no punctuation. Therefore, the part determined to be a headline (determined based on the fact that the font is larger than the other parts, the attribute of being a headline, etc.) may be determined as a whole sentence. .

(12)上記実施形態では、単語の重要度を算出する際に、文章全体のジャンルや属性(社会面の記事であるか、三面記事であるかや、論文であるか雑文であるかなど)により、単語について係数を設けるようにしてもよい。たとえば、社会面における「国会」は、通常出てくる単語であるから係数を低くする。一方、三面記事における「国会」は、あまり出てこない単語であるから係数を高くする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。 (12) In the above embodiment, when calculating the importance of a word, the genre and attributes of the whole sentence (whether it is a social article, a three-faced article, a paper or a miscellaneous sentence, etc.) Thus, a coefficient may be provided for the word. For example, the “National Diet” in society is a word that usually appears, so the coefficient is set low. On the other hand, “National Diet” in the three-page article is a word that does not appear so often, so the coefficient is increased. Multiply the calculated importance by this coefficient to obtain the final importance.

(13)上記実施形態では、文の重要度を算出する際に、文と文の関連性を考慮せずに行っている。しかし、文と文の関連性も考慮して重要度を算出するようにしてもよい。たとえば、「その」「彼」等の指示代名詞が当該文に出てくる場合、重要度によって選択され、並び替えられた抽出文において、当該文より前の文が抽出されていない場合には、当該指示代名詞を含む文の係数を小さくする。一方、「したがって」「つまり」などの、話題を展開する接続詞が文に含まれる場合、当該文の係数を大きくする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。







(13) In the above embodiment, the importance of a sentence is calculated without considering the relation between the sentence and the sentence. However, the importance may be calculated in consideration of the relationship between sentences. For example, when the pronouns such as “that” and “he” appear in the sentence, in the extracted sentence selected according to the importance and rearranged, the sentence before the sentence is not extracted. Reduce the coefficient of sentences containing the pronoun. On the other hand, if the sentence contains a conjunction that expands the topic, such as “so” or “that is”, the coefficient of the sentence is increased. Multiply the calculated importance by this coefficient to obtain the final importance.







Claims (15)

平面上に複数の記事を配置する記事配置決定装置であって、
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。
An article placement determination device that places a plurality of articles on a plane,
A recording unit that records multiple articles and the importance of each article, and records the degree of association between each article,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
Virtual article area arrangement determining means for determining the arrangement of the virtual article area such that the total attractive force of the virtual springs is reduced;
An article area arrangement determining means for determining the arrangement of the article area based on the determined arrangement of the virtual article area;
Article placement determination device with
コンピュータによって平面上に複数の記事を配置する記事配置決定装置を実現するための記事配置決定プログラムであって、コンピュータを、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。
An article arrangement determining program for realizing an article arrangement determining apparatus for arranging a plurality of articles on a plane by a computer,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
Virtual article area arrangement determining means for determining the arrangement of the virtual article area such that the total attractive force of the virtual springs is reduced;
An article arrangement determination program for functioning as article area arrangement determination means for determining the arrangement of article areas based on the determined arrangement of virtual article areas.
請求項1の装置または請求項2のプログラムにおいて、
前記装置は、前記仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、
前記仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えていることを特徴とする装置またはプログラム。
In the apparatus of claim 1 or the program of claim 2,
The apparatus further includes force total calculation means for calculating a total value of attractive forces of virtual springs arranged between the virtual article regions arranged on the virtual plane,
The virtual article area arrangement determining means changes the arrangement of the virtual article area on the virtual plane and the virtual article area arrangement means for arranging the virtual article area on the virtual plane so that the total value of the attractive force of the virtual spring is reduced. An apparatus or program comprising virtual article area arrangement change determining means for determining arrangement of a virtual article area.
請求項1〜3のいずれかの装置またはプログラムにおいて、
前記仮想記事領域生成手段は、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-3,
The virtual article region generation means generates a circle having an area corresponding to the importance of each article as the virtual article region.
請求項1〜4のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置手段は、最も重要度の高い仮想記事領域を、前記平面上の右上または左上に固定して配置することを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-4,
The virtual article area arranging unit arranges the virtual article area having the highest importance fixedly arranged at the upper right or upper left on the plane.
請求項1〜5のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置手段は、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-5,
The virtual article area arranging unit arranges virtual article areas in order from a pair of virtual article areas having a high degree of relevance.
請求項1〜6のいずれかの装置またはプログラムにおいて、
前記仮想バネ設定手段は、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-6,
The virtual spring setting means sets a virtual spring so that no attractive force is generated between virtual article regions that are in adjacent contact with each other.
請求項1〜7のいずれかの装置またはプログラムにおいて、
前記仮想バネ設定手段は、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-7,
The virtual spring setting means increases the spring constant as the degree of association between articles increases.
請求項1〜8のいずれかの装置またはプログラムにおいて、
前記仮想記事領域配置変更決定手段は、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-8,
The virtual article area arrangement change determining means performs an arrangement change by paying attention to a virtual article area related to a virtual spring having the greatest attraction.
平面上に複数の記事を配置する記事配置決定装置であって、
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。
An article placement determination device that places a plurality of articles on a plane,
A recording unit that records multiple articles and the importance of each article, and records the degree of association between each article,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Among the generated virtual article areas, those having the greatest importance are set as fixed virtual article areas fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are arranged on the virtual plane. In the virtual article region arrangement means to be a movable virtual article region that is arranged far away to allow overlapping with each other,
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. The article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area as a fixed virtual article area,
Article placement determination device with
コンピュータによって平面上に複数の記事を配置する記事配置決定装置を実現するための記事配置決定プログラムであって、コンピュータを、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。
An article arrangement determining program for realizing an article arrangement determining apparatus for arranging a plurality of articles on a plane by a computer,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Among the generated virtual article areas, those having the greatest importance are set as fixed virtual article areas fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are arranged on the virtual plane. In the virtual article region arrangement means to be a movable virtual article region that is arranged far away to allow overlapping with each other,
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. An article arrangement determining program for causing the movable virtual article area to function as article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area a fixed virtual article area.
請求項1〜11のいずれかの装置またはプログラムにおいて、
前記装置は、さらに、
解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、
単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段と、
を備えたことを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-11,
The apparatus further comprises:
A word extracting means for analyzing an article to be analyzed and extracting at least nouns constituting the article as a word;
Importance calculating means for calculating the importance of each word included in the article extracted by the word extracting means, and calculating the importance of each article based on the importance of each word;
A device or program comprising:
請求項1〜12のいずれかの装置またはプログラムにおいて、
前記装置は、さらに、
各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-12,
The apparatus further comprises:
Relevance calculating means for calculating relevance between articles based on words included in each article;
A device or program comprising:
請求項13の装置またはプログラムにおいて、
前記関連度算出手段は、
各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、
前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。
The apparatus or program of claim 13,
The relevance calculation means includes:
An important word determination means for determining a predetermined number of words as important words from the highest importance in each article;
Relevance between words that search for important words contained in one article for calculating the degree of association and important words contained in the other article for which the degree of association is calculated on a search site on the web and obtain the number of hits An inter-word relevance calculating means for calculating
Change the combination of the important words contained in the one article and the important words contained in the other article, and sum the relevance obtained by the inter-word relevance calculation means to calculate the relevance between both articles Between-article relevance calculation means,
A device or program comprising:
コンピュータによって平面上における複数の記事配置を決定する方法であって、当該コンピュータは、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、
生成された仮想記事領域を仮想平面上に配置し、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、
前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴とする記事配置決定方法。













A method of determining a plurality of article arrangements on a plane by a computer, the computer comprising:
Create a virtual article area that corresponds to each article and has an area according to the importance of each article,
Place the generated virtual article area on the virtual plane,
A virtual spring having a spring constant corresponding to the degree of association between each article is set between the corresponding virtual article regions,
Changing the placement of the virtual article area on the virtual plane, determining the placement of the virtual article area so that the total attractive force of the virtual springs is reduced,
An article arrangement determining method, wherein the article area arrangement is determined based on the determined virtual article area arrangement.













JP2015197663A 2015-10-05 2015-10-05 Article arrangement determination device Pending JP2016040723A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015197663A JP2016040723A (en) 2015-10-05 2015-10-05 Article arrangement determination device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015197663A JP2016040723A (en) 2015-10-05 2015-10-05 Article arrangement determination device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011150378A Division JP2013016135A (en) 2011-07-06 2011-07-06 Article arrangement determination device

Publications (1)

Publication Number Publication Date
JP2016040723A true JP2016040723A (en) 2016-03-24

Family

ID=55541026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015197663A Pending JP2016040723A (en) 2015-10-05 2015-10-05 Article arrangement determination device

Country Status (1)

Country Link
JP (1) JP2016040723A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (en) * 1995-07-31 1997-02-14 Fujitsu Ltd Data retrieval device
JPH11282834A (en) * 1998-03-27 1999-10-15 Dainippon Screen Mfg Co Ltd Article layout device
JP2001195428A (en) * 1999-11-02 2001-07-19 Atr Media Integration & Communications Res Lab Device for retrieving associative information
JP2007034663A (en) * 2005-07-27 2007-02-08 Sony Corp Information processor, information processing method, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (en) * 1995-07-31 1997-02-14 Fujitsu Ltd Data retrieval device
JPH11282834A (en) * 1998-03-27 1999-10-15 Dainippon Screen Mfg Co Ltd Article layout device
JP2001195428A (en) * 1999-11-02 2001-07-19 Atr Media Integration & Communications Res Lab Device for retrieving associative information
JP2007034663A (en) * 2005-07-27 2007-02-08 Sony Corp Information processor, information processing method, and program

Similar Documents

Publication Publication Date Title
US8793259B2 (en) Information retrieval device, information retrieval method, and program
Feng et al. Extending the entity-based coherence model with multiple ranks
JP2013016106A (en) Summary sentence generation device
Modi et al. Review on abstractive text summarization techniques (ATST) for single and multi documents
JP5538185B2 (en) Text data summarization device, text data summarization method, and text data summarization program
Roy et al. Combining local and global word embeddings for microblog stemming
Kabadjov et al. Multilingual statistical news summarization
Charnine et al. Conceptual text generation based on key phrases
JP2010055155A (en) Server device, information processing method, and program
Trap-Jensen Researching lexicographical practice
JP2013016135A (en) Article arrangement determination device
JP2016040723A (en) Article arrangement determination device
JP2017117021A (en) Keyword extraction device, content generation system, keyword extraction method, and program
JP2008112310A (en) Retrieval device, information retrieval system, retrieval method, retrieval program and recording medium
JP2019200494A (en) Display program, display method, and display device
JP2007233752A (en) Retrieval device, computer program and recording medium
Sano et al. A web page segmentation method based on page layouts and title blocks
JP2021149600A (en) Information processing device and program
JP6296651B2 (en) Document relationship extracting apparatus and program
JP6226314B2 (en) Search index building device, search index building method, and search index building device program
Wang et al. The STViewer, a visual method with sentiment analysis: retrieve information and visualize social media text better
Sano et al. A Web Page Segmentation Method by using Headlines to Web
Abulaish et al. A keyphrase-based tag cloud generation framework to conceptualize textual data
Kudelka et al. Social aspects of web page contents
JP2017142669A (en) Information output system, information output method and information output program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170612