JP2016040723A - Article arrangement determination device - Google Patents
Article arrangement determination device Download PDFInfo
- Publication number
- JP2016040723A JP2016040723A JP2015197663A JP2015197663A JP2016040723A JP 2016040723 A JP2016040723 A JP 2016040723A JP 2015197663 A JP2015197663 A JP 2015197663A JP 2015197663 A JP2015197663 A JP 2015197663A JP 2016040723 A JP2016040723 A JP 2016040723A
- Authority
- JP
- Japan
- Prior art keywords
- article
- virtual
- area
- arrangement
- importance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
この発明は、複数の記事をその重要度に応じて、適切に自動配置する装置に関するものである。 The present invention relates to an apparatus that automatically and appropriately arranges a plurality of articles according to their importance.
インターネットを介して、サーバ装置に記録されているコンテンツを、端末装置にて閲覧することが行われている。この際、閲覧に使用される端末装置としては、PC、スマートフォン、タブレットなどがあり、その画面の大きさも様々である。 Browsing the content recorded in the server device on the terminal device via the Internet. At this time, terminal devices used for browsing include PCs, smartphones, tablets, and the like, and the screens have various sizes.
このため、PCのような大画面を有する機器向けに最適に配置したニュース記事などを、スマートフォンなどの小画面しかない機器で閲覧すると、記事全体が表示されなかったり、全体を表示しようとすると極端に文字を小さくしなければならないという問題があった。 For this reason, if you browse news articles that are optimally arranged for devices with a large screen such as a PC on a device that has only a small screen such as a smartphone, the entire article may not be displayed or it may be extremely There was a problem that the characters had to be made smaller.
また、閲覧する端末装置が決まっていたとしても、記事の配置を人間が手作業で決定することは煩わしかった。 Further, even if the terminal device to be browsed is determined, it is troublesome for a human to manually determine the article layout.
そのため、コンテンツを自動的に配置するための装置が提案されている。たとえば、特許文献1には、コンテンツの再配置を自動的に行う装置が開示されている。この装置では、紙面のテーマに対応したコンテンツを検索し、再配置することができる。
Therefore, an apparatus for automatically arranging contents has been proposed. For example,
しかしながら、特許文献1の装置は、一旦配置された記事を入れ替えたい時などに、その自動的な再配置を行うものであり、最初からレイアウトを決定するものではない。また、記事の重要度に応じて、適切な記事の配置を自動的に決定することはできなかった。
However, the apparatus of
この発明は、上記のような問題点を解決して、記事の重要度に応じて、適切にコンテンツを配置することのできる記事配置決定装置を提供することを目的とする。 An object of the present invention is to solve the above-described problems and to provide an article arrangement determination device that can appropriately arrange contents according to the importance of articles.
(1)(2)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段とを備えている。 (1) (2) An article placement determination device according to the present invention is an article placement determination device that places a plurality of articles on a plane, and records a plurality of articles and the importance of each article, and between each article. A recording section that records the degree of relevance of the article, a virtual article area generating unit that generates a virtual article area corresponding to each article and having an area corresponding to the importance of each article, and a spring corresponding to the degree of association between the articles Virtual spring setting means for setting a virtual spring having a constant between the corresponding virtual article areas; virtual article area arrangement determining means for determining the arrangement of the virtual article areas so that the total attractive force of the virtual springs is reduced; An article area arrangement determining means for determining the arrangement of the article area based on the determined arrangement of the virtual article area.
したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。 Therefore, based on the total force of the virtual springs, a preferable article arrangement can be determined from the viewpoint of importance and relevance.
(3)この発明に係る記事配置決定装置は、仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えている。 (3) The article arrangement determining apparatus according to the present invention further includes force total calculation means for calculating a total value of attractive forces of virtual springs arranged between the virtual article areas arranged on the virtual plane, the virtual article area The placement determination means includes a virtual article area placing means for placing the virtual article area on the virtual plane, and a virtual article area that changes the placement of the virtual article area on the virtual plane so that the total value of the attractive force of the virtual spring is reduced. Virtual article region arrangement change determining means for determining the arrangement of the article.
したがって、配置を変えながら、バネの合計力の変化を見て、適切な配置を選択することができる。 Accordingly, it is possible to select an appropriate arrangement by changing the arrangement and looking at the change in the total force of the spring.
(4)この発明に係る記事配置決定装置は、仮想記事領域生成手段が、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴としている。 (4) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article region generating means generates a circle having an area corresponding to the importance of each article as the virtual article region.
したがって、記事配置のシミュレーションを容易に行うことができる。 Therefore, the article arrangement simulation can be easily performed.
(5)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、最も重要度の高い仮想記事領域を、記事を配置する平面上の右上または左上に固定して配置することを特徴としている。 (5) The article placement determining device according to the present invention is characterized in that the virtual article region placement means places the virtual article region having the highest importance fixed at the upper right or upper left on the plane on which the article is placed. Yes.
したがって、注目度の高い場所に、重要度の高い記事を配置することができる。 Therefore, articles with a high degree of importance can be arranged in places with a high degree of attention.
(6)この発明に係る記事配置決定装置は、仮想記事領域配置手段が、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴としている。 (6) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article area arranging means arranges the virtual article areas in order from a pair of virtual article areas having a high degree of association.
したがって、関連度の大きい記事を離さずに配置することが可能となる。 Therefore, articles with a high degree of relevance can be arranged without being separated.
(7)この発明に係る記事配置決定装置は、仮想バネ設定手段が、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴としている。 (7) The article arrangement determining apparatus according to the present invention is characterized in that the virtual spring setting means sets the virtual spring so that no attractive force is generated between the virtual article regions that are in contact with each other. .
したがって、両仮想記事領域を離そうとした場合には引力が働くことになり、この引力の合計の大きさを小さくすることで、適切な配置を選択することができる。 Therefore, an attractive force is applied when trying to separate both virtual article regions, and an appropriate arrangement can be selected by reducing the total size of the attractive force.
(8)この発明に係る記事配置決定装置は、仮想バネ設定手段が、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴としている。 (8) The article placement determining apparatus according to the present invention is characterized in that the virtual spring setting means increases the spring constant as the degree of association between articles increases.
したがって、関連度の高い記事であるほど、離そうとすると大きな引力が働くようにシミュレーションすることができる。 Therefore, it is possible to perform a simulation so that an article having a higher degree of relevance has a greater attractive force when it is released.
(9)この発明に係る記事配置決定装置は、仮想記事領域配置変更決定手段が、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴としている。 (9) The article arrangement determining apparatus according to the present invention is characterized in that the virtual article area arrangement change determining means changes the arrangement by paying attention to a virtual article area related to a virtual spring having the greatest attraction.
したがって、配置変更により、合計力が小さくなる可能性が高くなる。 Therefore, there is a high possibility that the total force is reduced by the arrangement change.
(10)(11)この発明に係る記事配置決定装置は、平面上に複数の記事を配置する記事配置決定装置であって、複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段とを備えている。 (10) (11) An article placement determination device according to the present invention is an article placement determination device that places a plurality of articles on a plane, and records a plurality of articles and the importance of each article, and between each article. A recording section that records the degree of relevance of the article, a virtual article area generating unit that generates a virtual article area corresponding to each article and having an area corresponding to the importance of each article, and at least the most generated virtual article area A virtual article area having a large importance is fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are allowed to overlap each other on the virtual plane. Virtual article region placement means as a movable virtual article region placed far away, and virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions; , The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. The article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area a fixed virtual article area.
したがって、配置変更などを行わなくとも、容易に適切な配置を実現することができる。 Therefore, an appropriate arrangement can be easily realized without changing the arrangement.
(12)この発明に係る記事配置決定装置は、解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段とをさらに備えている。 (12) The article arrangement determining device according to the present invention analyzes an article to be analyzed, extracts at least a noun constituting the article as a word, and each of the articles included in the article extracted by the word extracting means Importance calculating means for calculating the importance of each word and calculating the importance of each article based on the importance of each word.
したがって、単語の重要度に基づいて記事の重要度を算出することができる。 Therefore, the importance of an article can be calculated based on the importance of a word.
(13)この発明に係る記事配置決定装置は、各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段をさらに備えたことを特徴としている。 (13) The article arrangement determining apparatus according to the present invention is characterized by further comprising a relevance calculation means for calculating a relevance between articles based on words included in each article.
したがって、単語に基づいて、両記事間の関連度を算出することができる。 Therefore, the degree of association between both articles can be calculated based on the word.
(14)この発明に係る記事配置決定装置は、関連度算出手段が、各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段とを備えている。
(14) In the article arrangement determining device according to the present invention, the degree-of-relevance calculating means determines important words from the top with high importance in each article as important words,
Relevance between words that search for important words contained in one article for calculating the degree of association and important words contained in the other article for which the degree of association is calculated on a search site on the web and obtain the number of hits The relevance obtained by the inter-word relevance calculating means is changed by changing the combination of the inter-word relevance calculating means, the important word included in the one article, and the important word included in the other article. And an inter-article relevance calculating means for calculating the relevance between both articles.
したがって、検索サイトを利用して記事間の関連度を算出することができる。 Therefore, the degree of association between articles can be calculated using the search site.
(15)この発明に係る記事配置決定方法は、コンピュータによって平面上における複数の記事配置を決定する方法であって、当該コンピュータは、各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、生成された仮想記事領域を仮想平面上に配置し、各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴としている。 (15) The article arrangement determining method according to the present invention is a method of determining a plurality of article arrangements on a plane by a computer, the computer corresponding to each article, and having an area corresponding to the importance of each article. A virtual article region having the virtual article region is arranged on a virtual plane, and a virtual spring having a spring constant according to the degree of association between each article is set between the corresponding virtual article regions, The placement of the virtual article area on the virtual plane is changed, the placement of the virtual article area is determined such that the total attractive force of the virtual spring is reduced, and the placement of the article area is determined based on the determined placement of the virtual article area. It is characterized by deciding.
したがって、仮想バネの合計力に基づいて、重要度と関連度の観点から好ましい記事配置を決定することができる。 Therefore, based on the total force of the virtual springs, a preferable article arrangement can be determined from the viewpoint of importance and relevance.
「仮想記事領域生成手段」は、実施形態においては、ステップS71がこれに対応する。 In the embodiment, “virtual article region generation means” corresponds to step S71.
「仮想記事領域配置決定手段」は、実施形態においては、ステップS22〜32、S40、S41がこれに対応する。 In the embodiment, the “virtual article region arrangement determining unit” corresponds to steps S22 to S32, S40, and S41.
「仮想記事領域配置手段」は、実施形態においては、ランダムに仮想記事領域を配置する処理を実行するCPU34がこれに対応する。
In the embodiment, the “virtual article area arranging means” corresponds to the
「仮想記事領域配置変更決定手段」は、実施形態においては、仮想記事領域の配置を入れ替える処理を実行するCPU34がこれに対応する。
In the embodiment, the “virtual article area arrangement change determining unit” corresponds to the
「仮想バネ設定手段」は、実施形態においては、ステップS22がこれに対応する。 In the embodiment, “virtual spring setting means” corresponds to step S22.
「力合計算出手段」は、実施形態においては、バネの引力を合計する処理を実行するCPU34がこれに対応する。
In the embodiment, the “total force calculation unit” corresponds to the
「記事領域配置決定手段」は、実施形態においては、ステップS33がこれに対応する。 In the embodiment, “article region arrangement determining means” corresponds to step S33.
「単語抽出手段」は、実施形態においては、ステップS2がこれに対応する。 In the embodiment, “word extracting means” corresponds to step S2.
「重要度算出手段」は、実施形態においては、ステップS3〜S8がこれに対応する。 In the embodiment, “importance calculation means” corresponds to steps S3 to S8.
「関連度算出手段」は、実施形態においては、ステップS10〜S18がこれに対応する。 In the embodiment, “relevance calculation means” corresponds to steps S10 to S18.
「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
The “program” is a concept that includes not only a program that can be directly executed by the CPU, but also a source format program, a compressed program, an encrypted program, and the like.
1.記事配置決定装置の機能ブロック図
図1aに、この発明の一実施形態による記事配置決定装置の機能ブロック図を示す。仮想記事領域生成手段2は、記録部4に記録された各記事の重要度6に基づいた面積を有する仮想記事領域を生成する。仮想記事領域配置手段10は、生成された仮想記事領域を、仮想平面上に配置する。
1. Functional Block Diagram of Article Placement Determination Device FIG. 1a shows a functional block diagram of an article placement determination device according to an embodiment of the present invention. The virtual article
仮想バネ設定手段12は、記録部4に記録された記事間の関連度に応じたバネ定数を有する仮想バネを、対応する仮想記事領域間に設定する。仮想記事領域配置変更決定手段16は、力合計算出手段による合計力が小さくなるように、仮想平面上に配置された仮想記事領域の配置を変更して、決定する。記事領域配置決定手段18は、決定された仮想記事領域の配置に基づいて、記事領域の配置を決定する。
The virtual spring setting means 12 sets a virtual spring having a spring constant corresponding to the degree of association between articles recorded in the
図1bに、図1aの記事配置決定装置とともに用いる重要度・関連度算出装置の機能ブロック図を示す。単語抽出手段22は、記録部4に記録されている各記事20に含まれる単語を抽出する。重要度算出手段24は、抽出した単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する。算出した各記事の重要度は、各記事に対応づけて記録される。関連度算出手段26は、各記事に含まれる単語の重要度に基づいて、各記事間の関連度を算出する。たとえば、両記事における重要度の高い単語を組み合わせて検索サイトにて検索を行い、当該単語の組み合わせによるヒット件数の数によって関連度を決定する。以上のようにして算出された記事の重要度および記事間の関連度は、図1aの記録部4に記録される。
FIG. 1b shows a functional block diagram of an importance / relevance calculation device used with the article arrangement determination device of FIG. 1a. The
2.ハードウエア構成
図2に、図1a、図1bに示す記事配置決定装置および重要度・関連度算出装置のハードウエア構成を示す。CPU34には、メモリ36、ディスプレイ38、ハードディスク40、CD−ROMドライブ42、キーボード/マウス44、通信回路46が接続されている。通信回路46は、インターネットなどに接続するためのものである。
2. Hardware Configuration FIG. 2 shows a hardware configuration of the article arrangement determination device and the importance / relevance calculation device shown in FIGS. 1a and 1b. A
ハードディスク40には、WINDOWS(商標)などのオペレーティングシステム50、重要度・関連度算出プログラム52、記事配置決定プログラム53、形態素辞書54、複数の記事20が記録されている。オペレーティングシステム50、重要度・関連度算出プログラム52、記事配置決定プログラム53は、CD−ROM48に記録されていたものをCD−ROMドライブ42を介して、インストールしたものである。形態素辞書54には、単語とその品詞が対応づけて記録されている。
On the
3.重要度・関連度算出プログラム
重要度・関連度算出プログラム52のフローチャートを、図3、図4に示す。CPU34は、ハードディスク40に記録された記事20のうち、最初の記事20を対象記事とする(ステップS1)。
3. Importance / Relevance Calculation Program Flow charts of the importance /
CPU34は、記事に含まれる全ての文を対象として、形態素解析を行う(ステップS2)。図5に、形態素解析処理の詳細を示す。まず、CPU34は、ハードディスク40に記録されている形態素辞書54を参照して、記事の形態素を解析する(ステップS21)。この形態素解析は、従来より行われている一般的な手法を用いることができる。形態素解析の結果を、図6に示す。
The
次に、CPU34は、通信回路46を使用して、インターネットを介して、ウエブ上の百科事典や辞書(たとえばWikipedia(商標)やe-Words(商標))にアクセスする。そして、図6に示す形態素解析によって得られた連続する単語を結合し、これをウエブ上の百科事典や辞書、検索サイトにて検索する(ステップS22)。たとえば、「平素」と「は」を結合して「平素は」という単語を生成し、この単語が見出し語としてウエブ上の百科事典や辞書に存在するかどうか、あるいは検索サイトにおいて所定件数以上(たとえば1万件以上)ヒットするかどうかを検索する。たとえば、「平素+は」「格別+の」「IT+ソリューション」などは、ウエブ上で文節として使用されている例が多くあるので、検索サイトにおける検索で所定件数以上のヒットを得ることができる。また、「電子+書籍」などの単語は、百科事典や辞書の見出し語として存在する可能性がある。
Next, the
なお、この実施形態では、文の初めの単語を対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の百科事典・辞書に存在する、または検索サイトにて所定件数以上ヒットするものを抽出する。CPU34は、このようにして抽出した結合単語(たとえば「平素は」)を、図6のテーブルに記録するとともに、結合単語を構成する個々の単語(たとえば「平素」「は」)を図6のテーブルから削除する。これにより、テーブルは、図7に示すようになる。さらに、CPU34は、見いだされた結合単語を、形態素辞書54に追加登録する。
In this embodiment, the first word of the sentence is used as the target word, the subsequent words are sequentially combined, and the longest word exists in the encyclopedia / dictionary on the web, or a predetermined number or more on the search site. Extract hits. The
続いて、抽出された単語の次の単語(抽出されなかった場合は対象単語の次の単語)を次の対象単語として、後続の単語を順次結合して行き、最も長い単語としてウェブ上の辞書に存在するものを抽出する。この処理を、文末まで繰り返す。 Next, the next word after the extracted word (or the next word after the target word if it is not extracted) is used as the next target word, and subsequent words are sequentially combined, and the dictionary on the web as the longest word Extract what exists in. This process is repeated until the end of the sentence.
したがって、この実施形態によれば、形態素辞書54に登録されていない単語であっても、これを単語として抽出することができる。
Therefore, according to this embodiment, even a word that is not registered in the
続いて、CPU34は、上記で得た単語を結合する処理を行う(ステップS23)。たとえば、名詞が連続する場合にはこれを結合して一つの名詞とする。「福島」「第一」「原子力」「発電所」という4つの名詞が連続する場合、これを「福島第一原子力発電所」とする。同様に、人名の姓と名が連続する場合、これを結合する。その他、形態素の結合として一般に行われている手法を用いて、単語の結合を行う。CPU34は、得られた結合単語(たとえば、「福島第一原子力発電所」)を、図7のテーブルに記録するとともに、結合単語を構成する個々の単語(たとえば、「福島」「第一」「原子力」「発電所」)を図7のテーブルから削除する。
Subsequently, the
以上のようにして、形態素解析を行うことができる。 As described above, morphological analysis can be performed.
(3)TF値算出
次に、CPU34は、上記にて抽出した単語(この実施形態では名詞を含む単語のみを対象とする)について、TF(Term Frequency)値を算出する(ステップS3)。つまり、図7のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、TF値を算出する。
(3) TF Value Calculation Next, the
ここで、TF値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。 Here, the TF value is a value obtained by dividing the number of times the word appears in the sentence by the total number of words in the sentence.
TF=単語の出現回数/各単語の出現回数の合計
図8aに、各単語について算出したTF値を示す。CPU34は、算出したTF値をハードディスク40に記録する。
TF = number of appearances of words / total number of appearances of each word FIG. 8a shows the TF value calculated for each word. The
この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。 In this embodiment, by obtaining the appearance frequency of each word in the sentence, how much each word is emphasized in the sentence is calculated.
(4)IDF値算出
次に、CPU34は、各単語についてIDF(Inverse Document Frequency)値を算出する(ステップS4)。ここで、IDF値は、各単語の希少性(世間に流通している単語として一般的でないこと)を表すものである。当該単語の希少性が高いほど、IDF値は高くなる。
(4) IDF value calculation Next, the
この実施形態では、IDF値は、以下の式により算出するようにしている。 In this embodiment, the IDF value is calculated by the following equation.
IDF=log(当該単語の検索エンジンでのヒット数(ページ数)/検索エンジン上の総ページ数)
図9に、IDF値算出処理の詳細を示す。CPU34は、図7のテーブルに記録された最初の単語(この実施形態では名詞を含む単語のみを対象とする)を対象単語とする(ステップS41)。CPU34は、対象単語(たとえば「平素は」)を、インターネット上の検索サイト(たとえばYahoo!(商標)やgoogle(商標)など)にて検索する(ステップS42)。
IDF = log (number of hits (number of pages) in the search engine of the word / total number of pages on the search engine)
FIG. 9 shows details of the IDF value calculation process. The
この検索リクエストに応じて、検索サイトから検索結果が返信されてくるので、CPU34はこれを受信する。CPU34は、検索結果に含まれる対象単語のヒット数(当該単語が含まれるページ数)および検索サイトが対象としている総ページ数を取得し、メモリ36に記録する(ステップS43)。
In response to this search request, the search result is returned from the search site, so the
続いて、CPU34は、log(当該単語の検索エンジンでのヒット数(ページ数)/検索エンジン上の総ページ数)を計算して、IDF値を算出する(ステップS44)。CPU34は、算出したIDF値を、各単語に対応づけてハードディスク40に記録する(図8a参照)。
Subsequently, the
CPU34は、すべての単語についてIDF値を算出したかどうかを判断する(ステップS45)。図7のテーブルにおいて未処理の単語が残っていれば、CPU34は、次の単語を対象単語とする(ステップS46)。そして、ステップS42以下を繰り返す。このようにして、対象となる全ての単語についてIDF値を算出する。
The
(5)TF−IDF値算出
続いて、CPU34は、各単語につき、算出したTF値とIDF値に基づいて、TF−IDF値を計算する(ステップS5)。この実施形態では、TF値とIDF値との積を算出することにより、TF−IDF値を算出するようにしている。
(5) TF-IDF value calculation Subsequently, the
(6)Hot係数算出
続いて、CPU34は、Hot係数を算出する(ステップS6)。ここで、Hot係数とは、対象となる単語の現在における注目度を表す指数である。この実施形態では、ウエブ上の辞書において対象単語を検索し、当該対象単語がどの程度の頻度で、どの程度現在に近い時間で更新されているかを取得し、これに基づいて算出するようにしている。
(6) Hot coefficient calculation Subsequently, the
具体的には、当該単語について、最新の更新日から所定件数(たとえば100件)の更新日を取得し、これら更新日の平均日を算出して、現在の日との差を求める。この差が小さいほど、Hot係数を大きくする。 Specifically, for the word, a predetermined number (for example, 100) of update dates are acquired from the latest update date, an average date of these update dates is calculated, and a difference from the current date is obtained. The smaller the difference, the larger the Hot coefficient.
図10に、Hot係数算出処理の詳細を示す。CPU34は、図7のテーブルに記録された最初の単語(この実施形態では名詞を含む単語のみを対象とする)を対象単語とする(ステップS61)。CPU34は、対象単語を、インターネット上の辞書(ウエブ辞書)にアクセスし検索する(ステップS62)。
FIG. 10 shows details of the Hot coefficient calculation process. The
対象単語が見出し語として存在すれば、当該対象単語に対する説明などのデータが返信されてくる。見出し語として存在しなければ、存在しない旨(あるいはエラー)が返信されてくる。CPU34は、これを受けて、対象単語がウエブ上の辞書に見出し語として存在するかどうかを判断する(ステップS63)。
If the target word exists as a headword, data such as an explanation for the target word is returned. If it does not exist as a headword, a message that it does not exist (or an error) is returned. In response to this, the
見出し語として存在する場合、CPU34は、返信されてきた解説データ中に記録されている更新日を、最新のものから所定件数(ここでは100件)取得する(ステップS64)。
If it exists as a headword, the
図11に、返信されてくる解説データの例を示す。見出し語、内容などの項目の他、更新日の項目が設けられている。この更新日には、内容等について更新が行われた履歴が順に示されている。CPU34は、この更新日を最新のものから100件取得する。なお、更新が100件以下の場合には、当該単語のHot係数を1.0として、ステップS68に進む。
FIG. 11 shows an example of comment data returned. In addition to items such as headwords and contents, items of update date are provided. On this update date, the history in which the contents etc. have been updated is shown in order. The
次に、CPU34は、取得した100件の更新日の平均日を算出する。次に、CPU34は、現在日(内部時計に基づく)と平均日との差(絶対値)を算出する(ステップS66)。さらに、算出した差に基づいてHot係数を算出する(ステップS67)。
Next, the
この実施形態では、ハードディスク40に予め記録された係数テーブル(図12参照)に基づいてHot係数を決定する。たとえば、算出した差が10日であれば、Hot係数は2.6として決定される。CPU34は、算出したHot係数を、対象単語に対応づけて記録する(図8a参照)。
In this embodiment, the Hot coefficient is determined based on a coefficient table (see FIG. 12) recorded in advance on the
CPU34は、すべての単語についてHot係数を算出したかどうかを判断する(ステップS68)。図7のテーブルにおいて未処理の単語が残っていれば、CPU34は、次の単語を対象単語とする(ステップS69)。そして、ステップS62以下を繰り返す。このようにして、対象となる全ての単語についてHot係数を算出する。
The
なお、対象単語がウエブ上の辞書に見出し語として存在しない場合には、Hot係数を1.0とする(ステップS70)。 If the target word does not exist as an entry word in the dictionary on the web, the Hot coefficient is set to 1.0 (step S70).
(7)重要度・関連度の算出
CPU34は、各単語につき、TF−IDF値にHot係数を乗じて、重要度を算出する(図3のステップS7)。CPU34は、このようにして算出した重要度を、対象単語に対応づけて記録する(図8a参照)。続いて、CPU34は、対象記事に含まれる単語の重要度を総合計し、記事の重要度を算出する(ステップS8)。CPU34は、算出した重要度を、対応する記事に関連づけてハードディスク40に記録する(図8b参照)。
(7) Calculation of Importance / Relevance The
続いて、CPU34は、全ての記事について処理をしたかどうかを判断する(ステップS9)。未処理の記事が残っていれば、次の記事を対象記事とする(ステップS19)。全ての記事について処理をしたのであれば、CPU34は、記事間の関連度の算出処理に移る。
Subsequently, the
CPU34は、まず、i=1、j=i+1に設定する(ステップS10)。次に、記事K1(数字は、ハードディスク40に記録された記事の順序を表す)に含まれる単語のうち、重要度の高いものから10語を抽出する(ステップS11)。また、記事K2に含まれる単語のうち、重要度の高いものから10語を抽出する(ステップS12)。ここでは、図13に示すように、記事K1の重要単語と、記事K2の重要単語が選択されたものとする。
The
次に、CPU34は、記事K1の重要単語の一つと、記事K2の重要単語の一つとを組み合わせ、当該組み合わせた用語について、通信回路46を介して、インターネット上の検索エンジンにて検索を行う。CPU34は、検索結果として送られてくるヒット数を取得する(ステップS13)。このような検索を、記事K1の重要単語と、記事K2の重要単語のすべのて組合せについて行う。したがって、ここでは、10×10=100件の検索が行われることになる。
Next, the
CPU34は、これら検索結果としてのヒット数を合計し、合計ヒット件数を記事K1と記事K2の関連度R1,2として25億ヒット(億の単位にて四捨五入)をハードディスク40に記録する(ステップS14)。
The
次に、jをインクリメントし(ステップS15)、記事K1と記事K3の関連度R1,3を、上記と同様の処理によって算出する(ステップS10〜S14)。この処理を繰り返し、記事K1と記事K5の関連度R1,5までを算出すると(つまり、j=5を超えると)、CPU34はiをインクリメントする(ステップS16、S17)。また、jをi+1とする(ステップS17)。これにより、iは2、jは3となる。
Next, j is incremented (step S15), and the degree of association R1,3 between the article K1 and the article K3 is calculated by the same process as described above (steps S10 to S14). When this process is repeated until the degree of association R1,5 between the article K1 and the article K5 is calculated (that is, when j = 5 is exceeded), the
CPU34は、ステップS11以下を繰り返す。これにより、関連度R2,3、R2.4、R2,5が算出されることになる。さらに、iがインクリメントされ、関連度R3,4、R3,5が算出される。つづいて、関連度R4,5が算出される。 以上のようにして、各記事の重要度および各記事間の関連度が算出される。
The
(8)記事の配置
次に、CPU34は、記事配置決定プログラム53に基づき、各記事の配置を決定する。記事配置決定プログラム53のフローチャートを図15〜図17に示す。この実施形態では、記事間の関連度の大きさに比例した仮想バネが仮想記事領域間に設けられているものとし、仮想記事領域を配置した際の仮想バネの引力の合計が小さくなるように配置するようにしている。
(8) Article Arrangement Next, the
まず、CPU34は、各記事の重要度に比例した大きさの仮想記事領域を円として生成する(ステップS71)。次に、CPU34は、関連度Rの大きい順に記事KiとKjのペアをテーブルに記憶する(ステップS72、図18参照)。また、CPU34は、これら記事ペアの間に、関連度の大きさに応じたバネ定数を有する仮想バネをかける。
First, the
この実施形態では、図26Aに示すように、2つの仮想記事領域が接している状態において、仮想バネが自然長の状態となるように、仮想バネを仮想記事間にかけるようにしている。仮想記事領域が離れると、バネ定数の大きさに応じた引力が働くことになる。つまり、関連性の大きい記事ペアを離すと、仮想バネに大きな引力が生じることになる。 In this embodiment, as shown in FIG. 26A, in a state where two virtual article regions are in contact, a virtual spring is applied between the virtual articles so that the virtual spring is in a natural length state. When the virtual article region is separated, an attractive force according to the magnitude of the spring constant is applied. In other words, if an article pair with high relevance is released, a large attractive force is generated in the virtual spring.
そこで、この実施形態では、仮想記事領域を配置したときの仮想バネの引力の合計が小さくなるように、配置を決定するようにしている。これにより、関連性の高い記事が近くの位置にあるように配置されることになる。 Therefore, in this embodiment, the arrangement is determined so that the total attractive force of the virtual springs when the virtual article area is arranged becomes small. As a result, articles with high relevance are arranged so as to be in nearby positions.
次に、CPU34は、最も重要度の高い記事に対応する仮想記事領域を、仮想平面の右上に配置する(ステップS73、図19A参照)。ここでは、記事K1の重要度が最も高いものとして説明を進める。図19Aに示すように、記事K1に対応する仮想記事領域が仮想平面の右上に配置されることになる。なお、仮想平面は、記事を表示するための領域に対応して設定した仮想的な平面である。記事表示領域(端末装置のディスプレイの大きさ)の大きさ(縦・横)に比例して、仮想平面の大きさ(縦・横)も変化するように設定している。なお、この実施形態では、重要度の最も高い記事は、最も注目度の高い右上の場所に固定するものとしている。
Next, the
次に、図18のテーブル中から、最も関連度の高い記事のペアを読み出す(ステップS74)。ここでは、記事K1と記事K5のペアが選択される。CPU34は、選択した記事ペアの少なくとも一方が、すでに、仮想平面に配置されているか否かを判断する(ステップS75)。ここでは、記事K1が既に配置されているので、ステップS76に進む。ステップS76においては、取得した記事ペアを仮想平面に配置する。なお、配置の際に、新たに配置される記事については、ペアの記事と接するように、しかも可能な限り右上に近い位置となるように配置する(この実施形態では、上よりも右側であることを優先する)。
Next, the pair of articles having the highest degree of association is read out from the table of FIG. 18 (step S74). Here, a pair of article K1 and article K5 is selected. The
ここでは、図19Bに示すように、仮想バネがかけられた記事K1と記事K5が配置されることになる。なお、記事K1は既に配置済みであるから改めて配置はしない。なお、配置の際には、互いの仮想記事領域は重なり合わないようにする。 Here, as shown in FIG. 19B, an article K1 and an article K5 to which a virtual spring is applied are arranged. Since article K1 has already been arranged, it will not be arranged again. It should be noted that the virtual article areas are not overlapped when arranged.
上記のようにして記事ペアを配置すると、CPU34は、当該記事ペアを図18のテーブルから削除する(ステップS77)。次に、CPU34は、別置きされた記事が、仮想平面上にあるかどうかを判断する(ステップS78)。ここでは、別置きした記事はないので、ステップS80に進む。
When the article pair is arranged as described above, the
ステップS80において、CPU34は、図18のテーブルに記事ペアが残っているかどうかを判断する。ここでは、まだ記事ペアが残っているので、ステップS73に戻る。
In step S80, the
ステップS73においては、図18のテーブルに残った記事ペアのうち、最も関連度の高いものを選択する。ここでは、記事ペアK3、K5が選択される。この記事ペアK3、K5のうち記事K5が既に仮想平面に配置されているので、この記事ペアを、仮想平面に配置する(ステップS75、S76)。ここでは、図20Aのように、記事K5との間に仮想バネがかけられた記事K3が配置されることになる。 In step S73, the article pair having the highest degree of association is selected from the article pairs remaining in the table of FIG. Here, the article pair K3, K5 is selected. Of the article pairs K3 and K5, the article K5 is already arranged on the virtual plane, so this article pair is arranged on the virtual plane (steps S75 and S76). Here, as shown in FIG. 20A, an article K3 with a virtual spring is placed between the article K5 and the article K5.
上記の処理を終えると、次に、CPU34は、図18のテーブルから記事ペアK1、K3を読み出して配置する。ここでは、図20Aに示すように、既に記事K1および記事K3がともに配置されているので、記事K1と記事K3との間に仮想バネをかける処理を行うことになる。
When the above processing is completed, the
上記の処理を繰り返すことにより、すべての記事K1〜K5を仮想平面に配置する。これにより、図20Bに示すように、互いに仮想バネのかけられた記事K1〜K5が配置されることになる。 By repeating the above processing, all articles K1 to K5 are arranged on a virtual plane. Thereby, as shown in FIG. 20B, articles K1 to K5 with virtual springs applied to each other are arranged.
なお、上記にて説明した図18のテーブルとは異なるテーブルにて処理を行った場合の処理について、以下にいくつかの例を示す。たとえば、図21Aに示すように、記事K1とK5のペア、記事K1とK2のペア、記事K2とK3のペアを配置したものとする。この配置状態において、テーブルから記事K2とK5のペアを読み出した場合には、K3を矢印の方向に移動させるとともに、K2をK3に接するように矢印の方向に回転させる。このようにして、図21Bのように配置する。 Note that some examples of processing when processing is performed using a table different from the table of FIG. 18 described above are shown below. For example, as shown in FIG. 21A, it is assumed that a pair of articles K1 and K5, a pair of articles K1 and K2, and a pair of articles K2 and K3 are arranged. In this arrangement state, when a pair of articles K2 and K5 is read from the table, K3 is moved in the direction of the arrow, and K2 is rotated in the direction of the arrow so as to contact K3. Thus, it arrange | positions like FIG. 21B.
また、図22Aに示すように、記事K3を配置しようとする際に、記事K3が仮想空間からはみ出る場合、はみ出ない位置を探し出して配置する。あるいは、図22Bに示すように、できるだけはみ出る面積が小さくなるような位置を探し出して配置する。 As shown in FIG. 22A, when the article K3 protrudes from the virtual space when the article K3 is to be arranged, a position that does not protrude is found and arranged. Alternatively, as shown in FIG. 22B, a position where the protruding area is as small as possible is found and arranged.
また、テーブルから読み出した記事ペアのいずれもが、仮想空間に配置されていない場合には、当該記事ペアを別置きしておく(ステップS75、S90、S91)。たとえば、図23Aに示すように、記事K1とK5が配置されている状態で、記事K3とK4のペアをテーブルから読み出したとする。この場合には、記事K3とK4のペアを、図23Aに示すように別置きしておく。 If none of the article pairs read from the table is arranged in the virtual space, the article pair is placed separately (steps S75, S90, S91). For example, as shown in FIG. 23A, it is assumed that a pair of articles K3 and K4 is read from the table in a state where articles K1 and K5 are arranged. In this case, a pair of articles K3 and K4 is placed separately as shown in FIG. 23A.
別置きした記事ペアのいずれかが、仮想空間内に配置されれば、当該別置きしておいた記事ペアを仮想空間に配置する(ステップS78、S79)。たとえば、図23Aの状態において、テーブルから記事ペアK1、K4が読み出され、記事K4が配置されたとする(図23B参照)。いま、記事K4は記事K3とともに別置きされているので、これらペアを仮想空間に配置する。配置の仕方は、通常のペアを配置する場合と同様である。 If any of the separately placed article pairs is placed in the virtual space, the separately placed article pair is placed in the virtual space (steps S78 and S79). For example, in the state of FIG. 23A, article pairs K1 and K4 are read from the table and article K4 is arranged (see FIG. 23B). Since the article K4 is now placed separately with the article K3, these pairs are arranged in the virtual space. The arrangement method is the same as in the case of arranging a normal pair.
以下、図18のテーブルに従った説明に戻る。図18のテーブルに記事ペアが残っていなければ、CPU34は、ステップS80からステップS81に進む。ステップS81においては、別置きされた記事が残っているかどうかを判断する。別置きされた記事が残っていれば、それら全てを、仮想平面において、他の記事と重複せず、しかもできるだけ右上に近くなるように配置する(ステップS82)。
Hereinafter, the description returns to the table of FIG. If no article pair remains in the table of FIG. 18, the
以上のようにして、全ての記事の仮想記事領域について配置を終えると、円形の記事領域を矩形または矩形の組合せからなる記事領域に変形し、記事領域を決定する(ステップS83)。矩形への変形は、中心を変えずに、同じ面積を有する正方形に置き換える(所定比率の矩形を予め定義しておいてもよい)。たとえば、図24Aに示す場合であれば、図24Bに示すように変形されることになる。 As described above, when the arrangement of the virtual article areas of all articles is completed, the circular article area is transformed into an article area consisting of a rectangle or a combination of rectangles, and the article area is determined (step S83). The transformation into a rectangle is replaced with a square having the same area without changing the center (a rectangle with a predetermined ratio may be defined in advance). For example, in the case shown in FIG. 24A, it is deformed as shown in FIG. 24B.
続いて、CPU34は、記事領域の重複部分を回避し、また、記事領域間の隙間を埋めるように、各記事領域を変形する。このようにして、図25に示すような記事領域を得ることができる。
Subsequently, the
4.その他の実施形態
(1)上記実施形態では、2つの記事の重要単語の組合せにより検索を行い、そのヒット件数の合計によって関連度を算出するようにしている。しかしながら、次のようにして、関連度を算出するようにしてもよい。一方の記事の重要単語が、他方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これで、一方の記事から、他方の記事への関連度を得ることができる。次に、他方の記事の重要単語が、一方の記事に何語含まれているかを算出し、これを全ての重要単語について行って合計する。これにより、他方の記事から、一方の記事への関連度を得ることができる。最後に、一方の記事から他方の記事への関連度と、他方の記事から一方の記事への関連度を合計して、関連度を得る。
4). Other embodiments
(1) In the above embodiment, a search is performed using a combination of important words of two articles, and the relevance is calculated based on the total number of hits. However, the association degree may be calculated as follows. The number of important words in one article is calculated in the other article, and this is performed for all the important words and totaled. Thus, the degree of association from one article to the other article can be obtained. Next, how many important words of the other article are included in one article is calculated, and this is performed for all the important words and totaled. Thereby, the degree of relevance to one article can be obtained from the other article. Finally, the degree of association from one article to the other article and the degree of association from the other article to one article are summed to obtain the degree of association.
(2)上記実施形態では、バネ定数の大きい(すなわち関連度の高い)記事ペアから順に、仮想空間に配置するようにしている。このようにすることで、バネの引力が小さくなるような配置を目指している。 (2) In the above embodiment, the article pairs are arranged in the virtual space in order from the article pair having the larger spring constant (that is, the relevance degree). By doing in this way, it aims at arrangement | positioning that the attractive force of a spring becomes small.
しかし、仮想記事領域を配置した状態において、各仮想バネに働く引力を計算し、仮想バネに働く引力の合計が小さくなるように、仮想記事領域を入れ替えるようにして、配置を決定するようにしてもよい。 However, in the state where the virtual article area is arranged, the attractive force acting on each virtual spring is calculated, and the virtual article area is changed so that the total of the attractive forces acting on the virtual spring becomes small, and the arrangement is determined. Also good.
たとえば、最も重要度の高い記事K1の仮想記事領域を右上に配置した後、他の記事の仮想記事領域をランダムに配置する。この状態を示すのが、図27である。 For example, after the virtual article area of the article K1 having the highest importance is arranged on the upper right, the virtual article areas of other articles are arranged randomly. This state is shown in FIG.
ここで、CPU34は、各記事間のバネ定数に基づき、各バネに働く引力を合計する。つまり、下式にて力の合計Fを算出する。
Here, the
F=F1,2+F1,3+F1,4+F1,5+F1,6+F2,3+F2,4+F2,5+F2,6+F3,4+F3,5+F3,6+F4,5+F4,6+F5,6
ここで、Fi,jは、記事KiとKjに働く引力であり、記事KiとKjとの間にかけられた仮想バネのバネ定数pi,jと、記事KiとKjの互いの外周面がどれだけ離れているかを示す距離xi,jとの積によって求められる(図26B参照)。
F = F1,2 + F1,3 + F1,4 + F1,5 + F1,6 + F2,3 + F2,4 + F2,5 + F2,6 + F3,4 + F3,5 + F3,6 + F4,5 + F4,6 + F5,6
Here, Fi, j is the attractive force acting on the articles Ki and Kj, and how much the spring constant pi, j of the virtual spring applied between the articles Ki and Kj and the outer peripheral surfaces of the articles Ki and Kj. It is obtained by the product of the distances xi, j indicating whether they are separated (see FIG. 26B).
次に、CPU34は、上記のF1,2、F1,3、F1,4、F1,5、F1,6、F2,3、F2,4、F2,5、F2,6、F3,4、F3,5、F3,6、F4,5、F4,6、F5,6のうち、最も大きいものを選択する。たとえば、F2,5が最も大きいとする。つまり、記事K2と記事K5の間に最も大きな力が働いていることがわかる。したがって、記事K2と記事K5を近づけるように配置替えすることで、合計の力Fを小さくできる可能性があることになる。つまり、より関連性の高い記事を近くに配置できる可能性があることになる。
Next, the
CPU34は、記事K2と記事K5の双方に対して、0より大きい力で引き合う記事を探し出す。たとえば、記事K6は記事K2と接しており引力は0である、同様に、記事K3は記事K5と接しており引力は0である。したがって、記事K2、K5のいずれとも接していない記事K4だけがこの条件に合致するものとして選択されることになる。なお、固定配置される記事K1は、ここでは対象としない。
The
CPU34は、最も大きな力が働いている記事K2、K5と、選択した記事K4とを入れ替えて、合計の力Fを再計算する。つまり、選択した記事K4と記事K2の場所を入れ替える。そして、合計の力Fを再計算する。同様にして、記事K4と記事K5の場所を入れ替え、合計の力Fを再計算する。
The
そして、元の配置、記事K4とK2を入れ替えた配置、記事K4とK5を入れ替えた配置のうち、力Fが最も小さい配置を選択する。 Then, among the original arrangement, the arrangement in which the articles K4 and K2 are exchanged, and the arrangement in which the articles K4 and K5 are exchanged, an arrangement having the smallest force F is selected.
最も力Fが小さい配置が元の配置であれば、CPU34は、元の配置が好ましい配置であるとして決定する。記事K4とK2を入れ替えた配置または記事K4とK5を入れ替えた配置が最も力Fが小さい配置であれば、当該配置において、最も大きな引力の働く記事間の組合せを見いだし、上記の処理を繰り返す。このようにして、ある程度、力Fが小さくなる配置を決定することができる。
If the arrangement with the smallest force F is the original arrangement, the
上記実施形態では、最も大きな力が働いている記事K2と記事K5の双方に対して、0より大きい力で引き合う記事を探し出し、当該記事の仮想記事領域と入れ替えを行うようにしている。しかし、図27において、記事K6、K3も入れ替えを行う対象として選択するようにしてもよい。記事K6はK2に接しているがK5に接しておらず、記事K3はK5に接しているがK2に接しておらず、しかも、K6とK3は接していないからである。つまり、K2、K3、K6、K5の経路にて力が0ではない状態の仮想バネにてつながっているからである。 In the above embodiment, for both the article K2 and the article K5 where the greatest force is working, an article that attracts with a force larger than 0 is searched and replaced with the virtual article region of the article. However, in FIG. 27, articles K6 and K3 may also be selected as objects to be exchanged. This is because article K6 is in contact with K2 but not in contact with K5, article K3 is in contact with K5 but not with K2, and K6 and K3 are not in contact with each other. In other words, it is connected by a virtual spring in a state where the force is not 0 in the paths K2, K3, K6, and K5.
この場合、CPU34は、記事K3の仮想記事領域と記事K2の仮想記事領域を入れ替え、記事K6の仮想記事領域と記事K5の仮想記事領域とを入れ替えて、合計力の変化を見ることになる。
In this case, the
また、上記実施形態では、ランダムに仮想記事領域を配置するようにしている。しかし、図15、図16に示す処理にて仮想記事領域を配置した後、上記の入れ替えを行うようにしてもよい。 In the above embodiment, virtual article areas are randomly arranged. However, the above-described replacement may be performed after the virtual article region is arranged by the processing shown in FIGS.
さらに、上記実施形態では、入れ替えによって力Fの小さくなる配置を探し出している。しかし、最も重要度の大きい記事の仮想記事領域を固定配置した後、他の仮想記事領域をかなり離れた位置に仮配置し、仮想バネの力によって自然に収まる位置に決定するようにしてもよい。この場合、他の仮想記事領域(固定記事領域以外の仮想記事領域)は、移動中においての重なり合いを許容するようにする。ただし、固定配置された仮想記事領域と接した瞬間に、他の仮想記事領域との重なり合いを禁止するようにする。 Furthermore, in the said embodiment, the arrangement | positioning where force F becomes small by replacement is searched. However, after the virtual article area of the article having the highest importance is fixedly arranged, other virtual article areas are temporarily arranged at positions far away from each other, and may be determined to be naturally fitted by the force of the virtual spring. . In this case, other virtual article areas (virtual article areas other than the fixed article area) are allowed to overlap during movement. However, the overlap with other virtual article areas is prohibited at the moment of contact with the fixedly arranged virtual article area.
上記では、ステップS24、S40、S41において、仮想空間に配置されていない記事ペアの別置きの方法を説明した。しかし、当該記事ペアを別置きせずに、既に配置されている記事群に接するように配置し(この段階では、当該記事ペアと既に配置されている記事群との間には仮想バネを設けない)、最後に上記の入れ替えによって仮想バネに働く引力の合計が小さくなるようにしてもよい。 In the above description, the method of separately placing article pairs that are not arranged in the virtual space has been described in steps S24, S40, and S41. However, instead of placing the article pair separately, place the article pair so that it touches the already placed article group (at this stage, provide a virtual spring between the article pair and the already placed article group. Finally, the total attractive force acting on the virtual spring may be reduced by the above replacement.
なお、上記では、バネ定数kによる仮想バネの引力をF=k×xとしたが、Fがkおよびxの単調増加関数となるようにすればよい。たとえば、F=k×log(x)とすれば、距離の影響をより小さく評価することができる。 In the above description, the attractive force of the virtual spring by the spring constant k is F = k × x, but it is sufficient that F is a monotonically increasing function of k and x. For example, if F = k × log (x), the influence of distance can be evaluated smaller.
CPU34が、このようなシミュレーションを行うことで、よりバネ定数の大きい仮想記事領域が早く固定配置された仮想記事領域に接することになり、適切な配置を実現することができる。
By performing such a simulation, the
(3)上記実施形態では、右上に記事領域を固定的に配置している。これは、縦書きの記事において、右上が最も注目度が高いからである。横書きの場合には、左上に配置するようにしても良い。 (3) In the above embodiment, the article area is fixedly arranged at the upper right. This is because the attention level is the highest in the vertically written article. In the case of horizontal writing, it may be arranged at the upper left.
(4)上記実施形態では、仮想記事領域として円を用いたが、矩形、三角、六角などの他の図形を用いるようにしても良い。 (4) In the above embodiment, a circle is used as the virtual article area. However, other figures such as a rectangle, a triangle, and a hexagon may be used.
(5)上記実施形態では、固定的に配置された仮想記事領域を設けている。しかし、全ての仮想記事領域を移動可能にしてもよい。
(5) In the above embodiment, a fixedly arranged virtual article region is provided. However, all the virtual article areas may be movable.
5.要約文生成プログラム
上記実施形態では、記事の重要度・関連度に応じた記事領域の配置について説明した。このようにして配置した各記事領域には、当該記事を表示することになる。ただし、記事領域に表示できる文字数(文字フォントの大きさと記事領域の大きさによって決まる)よりも、記事の文字数が多い場合には、記事の内容を全て表示することができない。そこで、記事領域に表示できる文字数内の要約を作成し、これを記事領域に表示する必要が生じる。
5. Summary sentence generation program In the above embodiment, the arrangement of article areas according to the importance / relevance of articles has been described. The article is displayed in each article area arranged in this way. However, if the number of characters in the article is larger than the number of characters that can be displayed in the article area (determined by the size of the character font and the size of the article area), the entire contents of the article cannot be displayed. Therefore, it is necessary to create a summary within the number of characters that can be displayed in the article area and display it in the article area.
以下、要約文生成プログラムのフローチャートを、図28、図29に示す。 The summary sentence generation program flowcharts are shown in FIGS.
(1)文の抽出
CPU34は、ステップS101において、ハードディスク40に記録された記事の文章データから、文を抽出する(ステップS101)。この実施形態では、句点(「。」や「.」)に基づいて、文を抽出するようにしている。すなわち、句点が見いだされるまでを一つの文として抽出する。
(1) Sentence Extraction In step S101, the
たとえば、図30に示すような文章データ(記事)であれば、図31に示すように、文番号「1」〜「6」までの6つの文が抽出されることになる。CPU34は、このようにして抽出した文を、順番を示す文番号とともにハードディスク40に記録する。この際、CPU34は、各文の文字数を併せて記録する。
For example, in the case of sentence data (article) as shown in FIG. 30, as shown in FIG. 31, six sentences with sentence numbers “1” to “6” are extracted. The
(2)形態素解析
次に、CPU34は、文章データに含まれる全ての文を対象として、形態素解析を行う(ステップS102)。形態素解析処理の詳細は、図5に示すものと同様である。形態素解析の結果を、図7に示す。
(2) Morphological analysis Next, the
(3)TF値算出
次に、CPU34は、上記にて抽出した単語(この実施形態では名詞を含む単語のみを対象とする)について、TF(Term Frequency)値を算出する(ステップS103)。つまり、図7のテーブルに記録した品詞が名詞である単語および名詞を品詞として含む単語について、TF値を算出する。
(3) TF Value Calculation Next, the
ここで、TF値とは、当該単語が当該文章中において出現する回数を、文章中の延べ単語数で除した値である。 Here, the TF value is a value obtained by dividing the number of times the word appears in the sentence by the total number of words in the sentence.
TF=単語の出現回数/各単語の出現回数の合計
図8aに、各単語について算出したTF値を示す。CPU34は、算出したTF値をハードディスク40に記録する。
TF = number of appearances of words / total number of appearances of each word FIG. 8a shows the TF value calculated for each word. The
この実施形態では、当該文章中における各単語の出現頻度を得ることで、各単語が当該文章中において、どの程度強調されているのかを算出するようにしている。 In this embodiment, by obtaining the appearance frequency of each word in the sentence, how much each word is emphasized in the sentence is calculated.
(4)IDF値算出
次に、CPU34は、各単語についてIDF(Inverse Document Frequency)値を算出する(ステップS104)。IDF算出処理の詳細は、図9に示すものと同様である。CPU34は、算出したIDF値を、各単語に対応づけてハードディスク40に記録する(図8a参照)。
(4) IDF Value Calculation Next, the
(5)TF−IDF値算出
続いて、CPU34は、各単語につき、算出したTF値とIDF値に基づいて、TF−IDF値を計算する(ステップS105)。この実施形態では、TF値とIDF値との積を算出することにより、TF−IDF値を算出するようにしている。
(5) TF-IDF value calculation Subsequently, the
(6)Hot係数算出
続いて、CPU34は、Hot係数を算出する(ステップS106)。Hot係数算出処理の詳細は、図10に示すものと同様である。CPU34は、算出したHot係数を、対象単語に対応づけて記録する(図8a参照)。
(6) Hot coefficient calculation Subsequently, the
(7)重要度の算出
CPU34は、各単語につき、TF−IDF値にHot係数を乗じて、重要度を算出する(ステップS107)。CPU34は、このようにして算出した重要度を、対象単語に対応づけて記録する(図8a参照)。
(7) Calculation of
次に、CPU34は、各単語の重要度に基づいて重要単語を決定する(ステップS108)。この実施形態では、単語の重要度の平均値を算出し、この平均値を超える重要度を有する単語を重要単語として抽出している。たとえば、図8aに示す場合であれば、単語の重要度の平均値は11.40135438である。したがって、CPU34は、この平均値を超える重要度を有する単語「電子書籍」「図書館」「書籍」・・・「利用価値」を重要単語として選択することになる。
Next, the
次に、CPU34は、各文のうち重要単語が含まれる文について重要度を算出する。重要度は、当該文に含まれる各単語の重要度を合計することによって算出する(ステップS109)。たとえば、図31に示す文章の第1文「平素は、・・・申し上げます。」には、重要単語が含まれていないので、第1文についての重要度は算出しない。第2文「当社は従来より・・・参りました。」には、重要単語「当社」「図書館」「書籍」がふくまれているので重要度を算出する。CPU34は、各単語の重要度を図8aを参照して取得し、これを合計して重要度57.83187を得る。
Next, the
CPU34は、算出した各文の重要度を、各文に対応づけてハードディスク40に記録する(図31参照)。
The
(8)要約文の生成
次に、CPU34は、算出した各文の重要度に基づき、最も重要度の高い文を抽出する(ステップS110)ここでは、図31に示す第4文の重要度が最も高いので、第4文が選択される。CPU34は、選択した文の文字数の合計が、予め定められた指定文字数を超えているかどうかを判断する(ステップS111)。ここでは、記事領域に表示できる文字数が指定文字数となる。ここでは、指定文字数が、250文字であるとして説明を進める。
(8) Generation of Summary Sentence Next, the
第4文の文字数は、62文字である(図31参照)。したがって、指定文字数である250文字を超えていないので、ステップS12に進む。ステップS12では、次に重要度の高い文を抽出する。ここでは、第5文が選択されることになる。第5分の文字数は97文字である。したがって、選択された文の合計文字数は、62文字と97文字を合計して、160文字となる。よって、指定文字数である250文字を超えていないので、ステップS111からステップS112に進む。 The number of characters in the fourth sentence is 62 characters (see FIG. 31). Therefore, since the designated number of characters does not exceed 250, the process proceeds to step S12. In step S12, the next most important sentence is extracted. Here, the fifth sentence is selected. The fifth character number is 97 characters. Therefore, the total number of characters of the selected sentence is 160 characters, which is the sum of 62 characters and 97 characters. Therefore, since the designated number of characters does not exceed 250, the process proceeds from step S111 to step S112.
ステップS112では、さらに次に重要度の高い文を抽出する。このような処理を、選択された文の合計文字数が指定文字数250文字を超えるまで繰り返す。ここでは、第4文(62文字)、第5文(97文字)、第3文(74文字)、第2文(56文字)を抽出した時点で、合計文字数が289文字となって指定文字数を超える。 In step S112, the next most important sentence is extracted. Such processing is repeated until the total number of characters of the selected sentence exceeds the designated number of characters 250. Here, when the fourth sentence (62 characters), the fifth sentence (97 characters), the third sentence (74 characters), and the second sentence (56 characters) are extracted, the total number of characters becomes 289 characters and the designated number of characters. Over.
指定文字数を超えると、CPU34は、最後に抽出した文を抽出文から外す(ステップS113)。ここでは、第2文が最後に抽出した文であるから、第2文を抽出したものから外す。その結果、図32に示すように、第4文、第5文、第3文が抽出されることになる。
When the specified number of characters is exceeded, the
次に、CPU34は、抽出した文を、元の文章における順番(つまり文番号の若い順)に従って並び替える(ステップS114)。これにより、図33に示すような順番の抽出文を得ることができる。
Next, the
CPU34は、このようにして並び替えた抽出文を要約として出力する(ステップS115)。ここでは、図33に示す「書籍の電子化が・・・繋げたいと考えております。」という要約を、対応する表示領域に出力する。
The
以上の処理を、全ての表示領域について行う。これにより、各表示領域には、対応する記事の要約文が表示される。なお、CPU34は、要約文とともに、記事全文へのリンク情報を表示するようにしている。
The above processing is performed for all display areas. Thereby, the summary sentence of the corresponding article is displayed in each display area. The
6.その他の実施形態
(1)上記実施形態では、TF値(強調度)、IDF値(希少度)、Hot係数(注目度)に基づいて単語の重要度を算出するようにしている。しかしながら、これらのうちのいずれか一つを用いて重要度を算出したり、これらのうちのいずれか二つを組み合わせて重要度を算出するようにしてもよい。
6). Other embodiments
(1) In the above embodiment, the importance level of a word is calculated based on the TF value (enhancement level), IDF value (rareness level), and Hot coefficient (attention level). However, the importance may be calculated using any one of these, or the importance may be calculated by combining any two of these.
(2)上記実施形態では、当該文章における単語の出現回数に基づいて単語の強調度を算出するようにしている。しかし、文章中における単語の出現位置に基づいて、単語の強調度を判断するようにしてもよい。たとえば、文の後ろの方に出てくる単語の方が強調度を高くするようにしてもよい。さらに。出現回数と出現位置とを組み合わせて強調度を算出するようにしてもよい。 (2) In the above embodiment, the word emphasis degree is calculated based on the number of appearances of the word in the sentence. However, the degree of word emphasis may be determined based on the appearance position of the word in the sentence. For example, the word appearing at the back of the sentence may be enhanced. further. The enhancement degree may be calculated by combining the number of appearances and the appearance position.
(3)上記実施形態では、検索サイトにおける当該単語のヒット数と、検索対象の全ページ数との比率に基づいて希少度(IDF値)を算出するようにしている。しかし、辞書や百科事典(ウエブ上にあるものローカルにあるものを問わない)などにおいて当該単語が何回使用されているか(見出し項目だけでなく内容中に用いられている場合も含む回数)に基づいて、当該単語の希少度を算出するようにしてもよい。 (3) In the above embodiment, the rarity (IDF value) is calculated based on the ratio between the number of hits of the word on the search site and the total number of pages to be searched. However, how many times the word is used in dictionaries and encyclopedias (regardless of whether they are on the web or local), including how many times the word is used in the content Based on this, the degree of rarity of the word may be calculated.
(4)上記実施形態では、ウエブ上の辞書の更新日の平均値と現在日の差に基づいて、現在の注目度(Hot係数)を算出するようにしている。しかしながら、最新の更新日との差に基づいて、現在の注目度を算出するようにしてもよい。あるいは、所定期間内に更新が行われた回数を算出し、これに基づいて現在の注目度を算出するようにしてもよい(更新回数が多いほど、注目度が大きい)。 (4) In the above embodiment, the current attention level (Hot coefficient) is calculated based on the difference between the average value of the updated dictionaries on the web and the current date. However, the current attention level may be calculated based on the difference from the latest update date. Alternatively, the number of updates performed within a predetermined period may be calculated, and the current attention level may be calculated based on this (the higher the update count, the higher the attention level).
(5)上記実施形態では、各単語の重要度の平均値をしきい値として重要単語を抽出するようにしている。しかし、標準偏差、分散なども考慮して重要単語を抽出するようにしてもよい。 (5) In the above embodiment, important words are extracted using the average value of the importance of each word as a threshold value. However, important words may be extracted in consideration of standard deviation and variance.
(6)上記実施形態では、重要単語を含む文についてのみ重要度を算出するようにしている。しかし、全ての文について重要度を算出するようにしてもよい。 (6) In the above embodiment, the importance is calculated only for the sentence including the important word. However, importance may be calculated for all sentences.
(7)上記実施形態では、指定文字数を超えない範囲で、文を選択するようにしている。しかし、指定文字数と合計文字数の差の絶対値が最も小さくなるように文を選択するようにしてもよい。 (7) In the above embodiment, sentences are selected within a range not exceeding the specified number of characters. However, the sentence may be selected so that the absolute value of the difference between the specified number of characters and the total number of characters is minimized.
(8)上記実施形態では、指定文字数に基づいて文を選択するようにしている。しかし、文の合計数、行の合計数、文の合計データ量などに基づいて文を選択するようにしてもよい。 (8) In the above embodiment, a sentence is selected based on the designated number of characters. However, the sentence may be selected based on the total number of sentences, the total number of lines, the total data amount of the sentences, and the like.
(9)上記実施形態では、指定文字数などの文の選択基準は予め定められているものとしている。しかし、対象とする文章の文字数などに応じて、指定文字数などを可変にするようにしてもよい(たとえば、文章の文字数の半分を指定文字数とするなど)。これにより、文章の長さに対応した長さの要約文を得ることができる。 (9) In the above embodiment, it is assumed that sentence selection criteria such as the number of designated characters are predetermined. However, the number of designated characters may be made variable according to the number of characters in the target sentence (for example, half the number of characters in the sentence is designated as the designated number of characters). Thereby, a summary sentence having a length corresponding to the length of the sentence can be obtained.
(10)上記実施形態では、端末装置側において要約文作成処理を行っている。しかしながら、サーバ装置側において、要約文作成処理を行うようにしてもよい。 (10) In the above embodiment, the summary sentence creation process is performed on the terminal device side. However, the summary sentence creation process may be performed on the server device side.
(11)上記実施形態では、句点に基づいて文章中から「文」を抽出するようにしている。しかし、見出しなどのように句点のない文もある。そこで、見出しであると判断した部分(他の部分よりフォントが大きい、見出しであるとの属性が付与されている等により判断する)については、全体を一文であると判断するようにしてもよい。 (11) In the above embodiment, “sentence” is extracted from the sentence based on the punctuation mark. However, some sentences, such as headings, have no punctuation. Therefore, the part determined to be a headline (determined based on the fact that the font is larger than the other parts, the attribute of being a headline, etc.) may be determined as a whole sentence. .
(12)上記実施形態では、単語の重要度を算出する際に、文章全体のジャンルや属性(社会面の記事であるか、三面記事であるかや、論文であるか雑文であるかなど)により、単語について係数を設けるようにしてもよい。たとえば、社会面における「国会」は、通常出てくる単語であるから係数を低くする。一方、三面記事における「国会」は、あまり出てこない単語であるから係数を高くする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。 (12) In the above embodiment, when calculating the importance of a word, the genre and attributes of the whole sentence (whether it is a social article, a three-faced article, a paper or a miscellaneous sentence, etc.) Thus, a coefficient may be provided for the word. For example, the “National Diet” in society is a word that usually appears, so the coefficient is set low. On the other hand, “National Diet” in the three-page article is a word that does not appear so often, so the coefficient is increased. Multiply the calculated importance by this coefficient to obtain the final importance.
(13)上記実施形態では、文の重要度を算出する際に、文と文の関連性を考慮せずに行っている。しかし、文と文の関連性も考慮して重要度を算出するようにしてもよい。たとえば、「その」「彼」等の指示代名詞が当該文に出てくる場合、重要度によって選択され、並び替えられた抽出文において、当該文より前の文が抽出されていない場合には、当該指示代名詞を含む文の係数を小さくする。一方、「したがって」「つまり」などの、話題を展開する接続詞が文に含まれる場合、当該文の係数を大きくする。この係数を、算出した重要度に乗じて、最終的な重要度を得る。
(13) In the above embodiment, the importance of a sentence is calculated without considering the relation between the sentence and the sentence. However, the importance may be calculated in consideration of the relationship between sentences. For example, when the pronouns such as “that” and “he” appear in the sentence, in the extracted sentence selected according to the importance and rearranged, the sentence before the sentence is not extracted. Reduce the coefficient of sentences containing the pronoun. On the other hand, if the sentence contains a conjunction that expands the topic, such as “so” or “that is”, the coefficient of the sentence is increased. Multiply the calculated importance by this coefficient to obtain the final importance.
Claims (15)
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。 An article placement determination device that places a plurality of articles on a plane,
A recording unit that records multiple articles and the importance of each article, and records the degree of association between each article,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
Virtual article area arrangement determining means for determining the arrangement of the virtual article area such that the total attractive force of the virtual springs is reduced;
An article area arrangement determining means for determining the arrangement of the article area based on the determined arrangement of the virtual article area;
Article placement determination device with
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置決定手段と、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。 An article arrangement determining program for realizing an article arrangement determining apparatus for arranging a plurality of articles on a plane by a computer,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
Virtual article area arrangement determining means for determining the arrangement of the virtual article area such that the total attractive force of the virtual springs is reduced;
An article arrangement determination program for functioning as article area arrangement determination means for determining the arrangement of article areas based on the determined arrangement of virtual article areas.
前記装置は、前記仮想平面上に配置された各仮想記事領域間に配置された仮想バネの引力の合計値を算出する力合計算出手段をさらに備え、
前記仮想記事領域配置決定手段は、仮想記事領域を仮想平面に配置する仮想記事領域配置手段と、前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計値が小さくなるような仮想記事領域の配置を決定する仮想記事領域配置変更決定手段とを備えていることを特徴とする装置またはプログラム。 In the apparatus of claim 1 or the program of claim 2,
The apparatus further includes force total calculation means for calculating a total value of attractive forces of virtual springs arranged between the virtual article regions arranged on the virtual plane,
The virtual article area arrangement determining means changes the arrangement of the virtual article area on the virtual plane and the virtual article area arrangement means for arranging the virtual article area on the virtual plane so that the total value of the attractive force of the virtual spring is reduced. An apparatus or program comprising virtual article area arrangement change determining means for determining arrangement of a virtual article area.
前記仮想記事領域生成手段は、前記仮想記事領域として、各記事の重要度に応じた面積を有する円を生成することを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-3,
The virtual article region generation means generates a circle having an area corresponding to the importance of each article as the virtual article region.
前記仮想記事領域配置手段は、最も重要度の高い仮想記事領域を、前記平面上の右上または左上に固定して配置することを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-4,
The virtual article area arranging unit arranges the virtual article area having the highest importance fixedly arranged at the upper right or upper left on the plane.
前記仮想記事領域配置手段は、関連度の大きい仮想記事領域の対から順に、仮想記事領域を配置していくことを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-5,
The virtual article area arranging unit arranges virtual article areas in order from a pair of virtual article areas having a high degree of relevance.
前記仮想バネ設定手段は、隣接して接した状態にある仮想記事領域間においては、引力が生じないように仮想バネを設定することを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-6,
The virtual spring setting means sets a virtual spring so that no attractive force is generated between virtual article regions that are in adjacent contact with each other.
前記仮想バネ設定手段は、各記事間の関連度が大きいほどバネ定数を大きくすることを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-7,
The virtual spring setting means increases the spring constant as the degree of association between articles increases.
前記仮想記事領域配置変更決定手段は、最も引力の大きい仮想バネに関連する仮想記事領域に着目して、配置変更を行うことを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-8,
The virtual article area arrangement change determining means performs an arrangement change by paying attention to a virtual article area related to a virtual spring having the greatest attraction.
複数の記事および各記事の重要度を記録するとともに、各記事間の関連度を記録する記録部と、
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段と、
を備えた記事配置決定装置。 An article placement determination device that places a plurality of articles on a plane,
A recording unit that records multiple articles and the importance of each article, and records the degree of association between each article,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Among the generated virtual article areas, those having the greatest importance are set as fixed virtual article areas fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are arranged on the virtual plane. In the virtual article region arrangement means to be a movable virtual article region that is arranged far away to allow overlapping with each other,
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. The article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area as a fixed virtual article area,
Article placement determination device with
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成する仮想記事領域生成手段と、
生成された仮想記事領域のうち少なくとも最も大きい重要度を有するものを仮想平面上に互いに重複しないように固定的に配置した固定的仮想記事領域とするともに、他の仮想記事領域を当該仮想平面上において、互いに重複することを許容して遠方に配置した可動的仮想記事領域とする仮想記事領域配置手段と、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定する仮想バネ設定手段と、
前記仮想平面上に配置された前記可動的仮想記事領域を、設定された仮想バネの引力に従い、前記固定的仮想記事領域に向って移動させ、前記可動的仮想記事領域が前記固定的仮想記事領域に接すると、当該可動的仮想記事領域を固定的仮想記事領域とすることで、前記仮想記事領域の配置を決定する記事領域配置決定手段として機能させるための記事配置決定プログラム。 An article arrangement determining program for realizing an article arrangement determining apparatus for arranging a plurality of articles on a plane by a computer,
Virtual article region generation means for generating a virtual article region corresponding to each article and having an area according to the importance of each article;
Among the generated virtual article areas, those having the greatest importance are set as fixed virtual article areas fixedly arranged so as not to overlap each other on the virtual plane, and other virtual article areas are arranged on the virtual plane. In the virtual article region arrangement means to be a movable virtual article region that is arranged far away to allow overlapping with each other,
Virtual spring setting means for setting a virtual spring having a spring constant according to the degree of association between each article between the corresponding virtual article regions;
The movable virtual article region arranged on the virtual plane is moved toward the fixed virtual article region in accordance with the set attractive force of the virtual spring, and the movable virtual article region is moved to the fixed virtual article region. An article arrangement determining program for causing the movable virtual article area to function as article area arrangement determining means for determining the arrangement of the virtual article area by making the movable virtual article area a fixed virtual article area.
前記装置は、さらに、
解析対象となる記事を解析し、記事を構成する少なくとも名詞を単語として抽出する単語抽出手段と、
単語抽出手段によって抽出された記事に含まれる各単語の重要度を算出し、当該各単語の重要度に基づいて各記事の重要度を算出する重要度算出手段と、
を備えたことを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-11,
The apparatus further comprises:
A word extracting means for analyzing an article to be analyzed and extracting at least nouns constituting the article as a word;
Importance calculating means for calculating the importance of each word included in the article extracted by the word extracting means, and calculating the importance of each article based on the importance of each word;
A device or program comprising:
前記装置は、さらに、
各記事に含まれる単語に基づいて、各記事間の関連度を算出する関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。 In the apparatus or program in any one of Claims 1-12,
The apparatus further comprises:
Relevance calculating means for calculating relevance between articles based on words included in each article;
A device or program comprising:
前記関連度算出手段は、
各記事において重要度の高い上位から所定個の単語を重要単語として決定する重要単語決定手段と、
関連度を算出する一方の記事に含まれる重要単語と、関連度を算出する他方の記事に含まれる重要単語を、ウエブ上の検索サイトにて検索してヒット数を取得する単語間の関連度を算出する単語間関連度算出手段と、
前記一方の記事に含まれる重要単語と、前記他方の記事に含まれる重要単語との組み合わせを変えて、単語間関連度算出手段によって得た関連度を合計し、両記事間の関連度を算出する記事間関連度算出手段と、
を備えたことを特徴とする装置またはプログラム。 The apparatus or program of claim 13,
The relevance calculation means includes:
An important word determination means for determining a predetermined number of words as important words from the highest importance in each article;
Relevance between words that search for important words contained in one article for calculating the degree of association and important words contained in the other article for which the degree of association is calculated on a search site on the web and obtain the number of hits An inter-word relevance calculating means for calculating
Change the combination of the important words contained in the one article and the important words contained in the other article, and sum the relevance obtained by the inter-word relevance calculation means to calculate the relevance between both articles Between-article relevance calculation means,
A device or program comprising:
各記事に対応し、各記事の重要度に応じた面積を有する仮想記事領域を生成し、
生成された仮想記事領域を仮想平面上に配置し、
各記事間の関連度に応じたバネ定数を有する仮想バネを、対応する前記仮想記事領域間に設定し、
前記仮想平面上の仮想記事領域の配置を変更し、仮想バネの引力の合計が小さくなるような仮想記事領域の配置を決定し、
決定された仮想記事領域の配置に基づき、記事領域の配置を決定することを特徴とする記事配置決定方法。
A method of determining a plurality of article arrangements on a plane by a computer, the computer comprising:
Create a virtual article area that corresponds to each article and has an area according to the importance of each article,
Place the generated virtual article area on the virtual plane,
A virtual spring having a spring constant corresponding to the degree of association between each article is set between the corresponding virtual article regions,
Changing the placement of the virtual article area on the virtual plane, determining the placement of the virtual article area so that the total attractive force of the virtual springs is reduced,
An article arrangement determining method, wherein the article area arrangement is determined based on the determined virtual article area arrangement.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015197663A JP2016040723A (en) | 2015-10-05 | 2015-10-05 | Article arrangement determination device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015197663A JP2016040723A (en) | 2015-10-05 | 2015-10-05 | Article arrangement determination device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011150378A Division JP2013016135A (en) | 2011-07-06 | 2011-07-06 | Article arrangement determination device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016040723A true JP2016040723A (en) | 2016-03-24 |
Family
ID=55541026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015197663A Pending JP2016040723A (en) | 2015-10-05 | 2015-10-05 | Article arrangement determination device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016040723A (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944525A (en) * | 1995-07-31 | 1997-02-14 | Fujitsu Ltd | Data retrieval device |
JPH11282834A (en) * | 1998-03-27 | 1999-10-15 | Dainippon Screen Mfg Co Ltd | Article layout device |
JP2001195428A (en) * | 1999-11-02 | 2001-07-19 | Atr Media Integration & Communications Res Lab | Device for retrieving associative information |
JP2007034663A (en) * | 2005-07-27 | 2007-02-08 | Sony Corp | Information processor, information processing method, and program |
-
2015
- 2015-10-05 JP JP2015197663A patent/JP2016040723A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944525A (en) * | 1995-07-31 | 1997-02-14 | Fujitsu Ltd | Data retrieval device |
JPH11282834A (en) * | 1998-03-27 | 1999-10-15 | Dainippon Screen Mfg Co Ltd | Article layout device |
JP2001195428A (en) * | 1999-11-02 | 2001-07-19 | Atr Media Integration & Communications Res Lab | Device for retrieving associative information |
JP2007034663A (en) * | 2005-07-27 | 2007-02-08 | Sony Corp | Information processor, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8793259B2 (en) | Information retrieval device, information retrieval method, and program | |
Feng et al. | Extending the entity-based coherence model with multiple ranks | |
JP2013016106A (en) | Summary sentence generation device | |
Modi et al. | Review on abstractive text summarization techniques (ATST) for single and multi documents | |
JP5538185B2 (en) | Text data summarization device, text data summarization method, and text data summarization program | |
Roy et al. | Combining local and global word embeddings for microblog stemming | |
Kabadjov et al. | Multilingual statistical news summarization | |
Charnine et al. | Conceptual text generation based on key phrases | |
JP2010055155A (en) | Server device, information processing method, and program | |
Trap-Jensen | Researching lexicographical practice | |
JP2013016135A (en) | Article arrangement determination device | |
JP2016040723A (en) | Article arrangement determination device | |
JP2017117021A (en) | Keyword extraction device, content generation system, keyword extraction method, and program | |
JP2008112310A (en) | Retrieval device, information retrieval system, retrieval method, retrieval program and recording medium | |
JP2019200494A (en) | Display program, display method, and display device | |
JP2007233752A (en) | Retrieval device, computer program and recording medium | |
Sano et al. | A web page segmentation method based on page layouts and title blocks | |
JP2021149600A (en) | Information processing device and program | |
JP6296651B2 (en) | Document relationship extracting apparatus and program | |
JP6226314B2 (en) | Search index building device, search index building method, and search index building device program | |
Wang et al. | The STViewer, a visual method with sentiment analysis: retrieve information and visualize social media text better | |
Sano et al. | A Web Page Segmentation Method by using Headlines to Web | |
Abulaish et al. | A keyphrase-based tag cloud generation framework to conceptualize textual data | |
Kudelka et al. | Social aspects of web page contents | |
JP2017142669A (en) | Information output system, information output method and information output program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170612 |