JP7388617B2 - Calculation device, calculation method and calculation program - Google Patents
Calculation device, calculation method and calculation program Download PDFInfo
- Publication number
- JP7388617B2 JP7388617B2 JP2017166532A JP2017166532A JP7388617B2 JP 7388617 B2 JP7388617 B2 JP 7388617B2 JP 2017166532 A JP2017166532 A JP 2017166532A JP 2017166532 A JP2017166532 A JP 2017166532A JP 7388617 B2 JP7388617 B2 JP 7388617B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- posted
- posted information
- name
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 193
- 238000000034 method Methods 0.000 claims description 28
- 238000010187 selection method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000010365 information processing Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 235000000832 Ayote Nutrition 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
Images
Description
本発明は、算出装置、算出方法及び算出プログラムに関する。 The present invention relates to a calculation device, a calculation method, and a calculation program.
従来、ユーザから入力されたクエリを集計して出力する情報処理装置によって、他のユーザが入力したクエリを参考に検索したいユーザのために、検索頻度が急上昇している注目のクエリをかかるユーザへ出力することが行われている。 Conventionally, an information processing device that aggregates and outputs queries entered by users has been used to provide users with popular queries whose search frequency is rapidly increasing, for users who wish to search based on queries entered by other users. Output is being done.
注目のクエリを抽出する方法として、例えば、検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出できる技術が知られている。 As a method for extracting a query of interest, for example, a technique is known that can extract a query whose search frequency has suddenly increased, and also extract the reason why the search frequency has suddenly increased.
しかしながら、上述の従来技術では、キーワード情報同士の関連度を高精度で算出できるとは限らない。例えば、上述の従来技術では、検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出しているに過ぎず、キーワード情報同士の関連度を高精度で算出できるとは限らない。 However, with the above-mentioned conventional technology, it is not always possible to calculate the degree of association between keyword information with high accuracy. For example, the above-mentioned conventional technology only extracts queries whose search frequency has suddenly increased, and also extracts the reason why the search frequency has suddenly increased. It is not always possible to calculate
本願は、上記に鑑みてなされたものであって、キーワード情報同士の関連度を高精度で算出できる算出装置、算出方法及び算出プログラムを提供することを目的とする。 The present application has been made in view of the above, and aims to provide a calculation device, a calculation method, and a calculation program that can calculate the degree of association between keyword information with high accuracy.
本願に係る算出装置は、ユーザによって投稿される投稿情報を取得する取得部と、前記取得部によって取得された投稿情報に基づいて、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との関連度を算出する算出部と、を備えたことを特徴とする。 The calculation device according to the present application includes an acquisition unit that acquires posted information posted by a user, and a first keyword information and a second keyword information related to the first keyword information based on the posted information acquired by the acquisition unit. A calculation unit that calculates the degree of association with keyword information.
実施形態の一態様によれば、キーワード情報同士の関連度を高精度で算出できるという効果を奏する。 According to one aspect of the embodiment, it is possible to calculate the degree of association between keyword information with high accuracy.
以下に、本願に係る算出装置、算出方法及び算出プログラムの実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る算出装置、算出方法及び算出プログラムが限定されるものではない。 Embodiments of a calculation device, a calculation method, and a calculation program according to the present application will be described in detail below with reference to the drawings. Note that this embodiment does not limit the calculation device, calculation method, and calculation program according to the present application.
〔1.第1の実施形態〕
〔1-1.算出装置の情報処理の一例〕
図1を用いて、第1の実施形態に係る算出処理の一例について説明する。図1は、第1の実施形態に係る算出処理の一例を示す図である。図1では、算出装置100により算出処理が実行される例を示す。
[1. First embodiment]
[1-1. Example of information processing of calculation device]
An example of the calculation process according to the first embodiment will be described using FIG. 1. FIG. 1 is a diagram illustrating an example of calculation processing according to the first embodiment. FIG. 1 shows an example in which calculation processing is executed by the
図1に示すように、算出システム1は、外部装置10と、端末装置20と、算出装置100とを含む。外部装置10、端末装置20及び算出装置100は、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図1に示す算出システム1には、複数台の外部装置10や、複数台の端末装置20や、複数台の算出装置100が含まれてもよい。
As shown in FIG. 1, the
第1の実施形態に係る外部装置10は、SNSサーバであり、例えば、会員登録されているユーザから記事やプロフィール画像等を投稿された投稿情報を受け付け、受け付けた投稿情報を記憶する。そして、外部装置10は、ユーザによって投稿された投稿情報を算出装置100へ提供する。図1に示す例において、外部装置10は、ユーザによって投稿された投稿情報を提供するSNSサーバ装置である場合を例として説明する。また、図1に示す例において、外部装置10の記憶部は、ユーザによって投稿された投稿情報を記憶するものとする。
The
第1の実施形態に係る端末装置20は、ブラウザに表示されるウェブページやアプリに表示されるコンテンツ等のウェブコンテンツにアクセスするユーザによって利用される情報処理装置である。例えば、端末装置20は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。
The
第1の実施形態に係る算出装置100は、例えば、ニュース記事やブログ等で注目されるキーワードであるバズワードを第1キーワード情報として抽出し、ニュース記事やブログ等で第1キーワード情報と共起されるキーワードや高頻度で登場するキーワードを第1キーワード情報に関連する第2キーワード情報(以下、関連語と表記する)として抽出する。そして、算出装置100は、ユーザによって投稿された投稿情報のうち、第1キーワード情報と関連語との位置の近さに基づいて、投稿情報を選択する。そして、算出装置100は、かかる投稿情報を要約として生成する。以下、算出装置100により、人名である第1キーワード情報と、サ変名詞である関連語との関連度の算出処理が実行される一例を説明する。
The
具体的には、算出装置100は、ユーザによって投稿された投稿情報を外部装置10から取得する。そして、算出装置100は、外部装置10から取得された投稿情報に人名と人名に関連する関連語とが含まれる場合に、人名と関連語との位置の近さに基づいて投稿情報を選択する。続いて、算出装置100は、人名と関連語との位置が最も近い投稿情報における人名と関連語との関連度を算出する。そして、算出装置100は、人名と関連語との位置が最も近い投稿情報を要約として生成する。
Specifically, the
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、算出装置100は、ユーザによって投稿された投稿情報を外部装置10から取得する。そして、算出装置100は、外部装置10から取得された投稿情報に「XXXX」と「当選」とが含まれる場合に、「XXXX」と「当選」との位置の近さが最も近い投稿情報を選択する。続いて、算出装置100は、「XXXX」と「当選」との位置が近い投稿情報における「XXXX」と「当選」との関連度を算出する。そして、算出装置100は、「XXXX」と「当選」との位置の近さが最も近い投稿情報を要約として生成する。
For example, assume that a person's name is "XXXX" and the related word related to the person's name is the sa-bun noun "election." In this case, the
以下、図1を用いて、算出装置100によるユーザによって投稿された投稿情報に基づいて人名と関連語との関連度の算出処理の一例を流れに沿って説明する。
Hereinafter, an example of a process of calculating the degree of association between a person's name and a related word based on posted information posted by a user by the
まず、図1に示すように、算出装置100は、ユーザによって投稿された投稿情報ST11~ST16を外部装置10から取得する(ステップS1)。そして、算出装置100は、ユーザによって投稿された投稿情報に人名と関連語とが含まれる場合に、人名と関連語との位置の近さに基づいて、投稿情報ST14を選択する(ステップS2)。
First, as shown in FIG. 1, the
ここで、図2を用いて、ユーザに投稿された投稿情報ST21~ST24から、人名と関連語との位置の近さに基づいて、投稿情報ST22を選択する処理について説明する。図2は、第1の実施形態に係る算出処理における人名と関連語との位置関係を例示する概念図である。図2に示すように、投稿情報ST21「XXXXAAAAAAAAAAAAAAAAAAAA当選」では、人名「XXXX」と関連語「当選」との間が「A」という任意の文字によって占められており、このときの「A」の文字数は20文字である。そして、投稿情報ST22では人名と関連語との間の「A」の文字数は5文字であり、投稿情報ST23では人名と関連語との間の「A」の文字数は7文字であり、投稿情報ST24では人名と関連語との間の「A」の文字数は9文字である。そして、算出装置100は、投稿情報ST21~ST24の中から人名と関連語との間の「A」の文字数が最も小さい投稿情報ST22を選択する。すなわち、算出装置100は、人名と関連語との位置の近さが最も近い投稿情報ST22を選択する。
Here, with reference to FIG. 2, a process of selecting posted information ST22 from posted information ST21 to ST24 posted by a user based on the proximity of a person's name and a related word will be described. FIG. 2 is a conceptual diagram illustrating the positional relationship between a person's name and related words in the calculation process according to the first embodiment. As shown in FIG. 2, in posted information ST21 "XXXXAAAAAAAAAAAAAAAAAAAAAAAAWIN", the space between the person's name "XXXX" and the related word "WIN" is occupied by the arbitrary character "A", and in this case, the character "A" is The number of characters is 20. In the posted information ST22, the number of characters of "A" between the person's name and the related word is 5 characters, and in the posted information ST23, the number of characters of "A" between the person's name and the related word is 7 characters, and the number of characters of "A" between the person's name and the related word is 7 characters, and the posted information In ST24, the number of characters "A" between the person's name and the related word is nine. Then, the
図1に戻り、第1の実施形態に係る算出処理の一例を説明する。算出装置100は、人名と関連語との位置が最も近い投稿情報ST14における人名と関連語との関連度を算出する(ステップS3)。例えば、算出装置100は、KNPやCaboCha(カボチャ)等の係り受け解析を用いて、投稿情報ST14「XXXXが大統領選に当選」における人名「XXXX」と関連語「当選」との関連度を90%として算出する。
Returning to FIG. 1, an example of the calculation process according to the first embodiment will be described. The
続いて、算出装置100は、投稿情報ST14を要約としてユーザに提供する(ステップS4)。例えば、算出装置100は、プッシュ通知やリアルタイム検索等の技術により要約をユーザに提供する。なお、算出装置100は、関連度が所定の閾値以上である場合に、投稿情報ST14を要約としてユーザに提供してもよい。
Subsequently, the
このように、第1の実施形態に係る算出装置100は、外部装置10から取得された投稿情報に含まれる人名と関連語との位置の近さに基づいて、人名と関連語との位置が最も近い投稿情報を選択する。そして、算出装置100は、投稿情報に含まれる人名と関連語との関連度を算出する。これにより、第1の実施形態に係る算出装置100は、人名と関連語との位置の近さに基づいて選択された投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
In this way, the
〔1-2.算出装置の構成〕
次に、図3を用いて、第1の実施形態に係る算出装置100の構成について説明する。図3は、第1の実施形態に係る算出装置100の構成例を示す図である。図3に示すように、算出装置100は、通信部110と、記憶部120と、制御部130とを有する。
[1-2. Configuration of calculation device]
Next, the configuration of the
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線又は無線で接続され、外部装置10と端末装置20との間で情報の送受信を行う。
The communication unit 110 is realized by, for example, a NIC (Network Interface Card). The communication unit 110 is connected to the network N by wire or wirelessly, and transmits and receives information between the
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、投稿情報記憶部121と、関連度情報記憶部122と、要約情報記憶部123とを有する。
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 120 includes a posted
第1の実施形態に係る投稿情報記憶部121は、ユーザによって投稿された投稿情報を記憶する。ここで、図4に、第1の実施形態に係る投稿情報記憶部121の一例を示す。図4に示した例では、投稿情報記憶部121は、「ユーザID」、「投稿情報ID」、「投稿情報」といった項目を有する。
The posted
「ユーザID」は、ユーザを識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「投稿情報」は、ユーザによって投稿される投稿内容を示す。例えば、図4では、ユーザID「U1」によって識別されるユーザが、投稿情報ID「PO1」によって識別される投稿情報である「XXXXがYYYを下し、大統領に当選」を投稿したことを示す。なお、以下では、投稿情報ID「PON(Nは任意の数)」により識別される投稿情報を「投稿情報PON」と表記する場合がある。 "User ID" indicates identification information for identifying a user. "Posted information ID" indicates identification information for identifying posted information posted by a user. "Posted information" indicates posted content posted by a user. For example, FIG. 4 shows that the user identified by the user ID "U1" posted the posted information identified by the posted information ID "PO1", "XXXX defeats YYY and wins the presidential election". . Note that, hereinafter, the posted information identified by the posted information ID "PON (N is an arbitrary number)" may be referred to as "posted information PON."
第1の実施形態に係る関連度情報記憶部122は、ユーザによって投稿される投稿内容に含まれる人名と人名に関連する関連語とに関する情報を記憶する。ここで、図5に、第1の実施形態に係る関連度情報記憶部122の一例を示す。図5に示した例では、関連度情報記憶部122は、「投稿情報ID」、「人名」、「関連語」、「関連度」といった項目を有する。
The relevance
「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「人名」は、ユーザによって投稿される投稿情報に含まれる人名を示す。「関連語」は、ユーザによって投稿される投稿情報に含まれる人名に関連する関連語を示す。「関連度」は、ユーザによって投稿される投稿情報に含まれる人名と関連語との関連度(例えば、単位は%)を示す。例えば、図5では、投稿情報PO1における人名は、「XXXX」であり、かかる人名「XXXX」に関連する関連語は、「当選」であり、人名「XXXX」と関連語「当選」との関連度は、90%であることを示す。 "Posted information ID" indicates identification information for identifying posted information posted by a user. "Person's name" indicates a person's name included in the posted information posted by the user. "Related word" indicates a related word related to a person's name included in posted information posted by a user. The “degree of association” indicates the degree of association (for example, in %) between a person's name and a related word included in posted information posted by a user. For example, in FIG. 5, the person's name in posted information PO1 is "XXXX", the related word related to the person's name "XXXX" is "winning", and the relationship between the person's name "XXXX" and the related word "winning" The degree indicates 90%.
第1の実施形態に係る要約情報記憶部123は、ユーザによって投稿される投稿内容を要約した要約に関する情報を記憶する。ここで、図6に、第1の実施形態に係る要約情報記憶部123の一例を示す。図6に示した例では、要約情報記憶部123は、「要約情報ID」、「投稿情報ID」、「要約情報」といった項目を有する。
The summary
「要約情報ID」は、ユーザによって投稿される投稿情報を要約した要約情報を識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「要約情報」は、ユーザによって投稿される投稿情報を要約した要約内容を示す。例えば、図6では、要約情報ID「SU1」は、投稿情報PO1に対応した要約であり、かかる要約内容は要約情報「XXXXが大統領選に当選」であることを示す。 "Summary information ID" indicates identification information for identifying summary information that summarizes posted information posted by a user. "Posted information ID" indicates identification information for identifying posted information posted by a user. "Summary information" indicates summary content that summarizes the posted information posted by the user. For example, in FIG. 6, the summary information ID "SU1" is a summary corresponding to the posted information PO1, and the content of the summary indicates that the summary information "XXXX wins the presidential election."
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、算出装置100内部の記憶装置に記憶されている各種プログラム(算出プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
The control unit 130 is a controller, and for example, uses a CPU (Central Processing Unit), an MPU (Micro Processing Unit), etc. to execute various programs (an example of a calculation program) stored in a storage device inside the
図3に示すように、制御部130は、取得部131と、選択部132と、算出部133と、生成部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, a selection unit 132, a calculation unit 133, a generation unit 134, and a
取得部131は、ユーザによって投稿される投稿情報を外部装置10から取得する。例えば、取得部131は、人名と関連語とを含む投稿情報を取得する。そして、取得部131は、投稿情報を投稿情報記憶部121に格納する。
The acquisition unit 131 acquires posted information posted by a user from the
選択部132は、取得部131によって取得された第1キーワード情報(人名に相当)と第2キーワード情報(関連語に相当)との双方が含まれる投稿情報のうち、人名と関連語との位置の近さに基づいて投稿情報を選択する。 The selection unit 132 selects the positions of the person's name and the related word among the posted information that includes both the first keyword information (corresponding to the person's name) and the second keyword information (corresponding to the related word) acquired by the acquisition unit 131. Select posting information based on proximity to.
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、図4の例では、選択部132は、取得部131によって取得された投稿情報に「XXXX」と「当選」とが含まれる場合に、「XXXX」と「当選」との位置の近さに基づいて投稿情報PO5を選択する。 For example, assume that a person's name is "XXXX" and the related word related to the person's name is the sa-bun noun "election." In this case, in the example of FIG. 4, when the posted information acquired by the acquisition unit 131 includes “XXXX” and “winning”, the selection unit 132 selects The posted information PO5 is selected based on the information.
算出部133は、取得部131によって取得された投稿情報に基づいて、人名と、人名と関連する関連語との関連度を算出する。具体的には、算出部133は、取得部131によって取得された投稿情報のうち、人名と関連語との双方が含まれる投稿情報に基づいて、人名と関連語との関連度を算出する。例えば、図5の例では、算出部133は、選択部132によって選択された人名と関連語とを含む投稿情報において、KNPやCaboCha等の係り受け解析を用いて、人名「XXXX」と関連語「当選」との関連度を90%として算出する。そして、算出部133は、関連度を関連度情報記憶部122に格納する。
The calculation unit 133 calculates the degree of association between a person's name and a related word related to the person's name based on the posted information acquired by the acquisition unit 131. Specifically, the calculation unit 133 calculates the degree of association between a person's name and a related word based on posted information that includes both a person's name and a related word, out of the posted information acquired by the acquisition unit 131. For example, in the example of FIG. 5, the calculation unit 133 uses dependency analysis such as KNP and CaboCha to calculate the person name “XXXX” and related words in the posted information that includes the person name and related words selected by the selection unit 132. The degree of relevance with "winning" is calculated as 90%. Then, the calculation unit 133 stores the degree of association in the degree of association
生成部134は、取得部131によって取得された投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成する。具体的には、生成部134は、選択部132によって選択された投稿情報を要約として生成する。例えば、図6の例では、生成部134は、選択部132によって選択された投稿情報「XXXXが大統領選に当選」を要約として生成する。なお、生成部134は、選択部132によって選択された投稿情報を適宜編集することで、要約を生成してもよい。例えば、人名「XXXX」と関連語「当選」を残し、他の文字を短縮する。 The generation unit 134 generates a summary based on posted information selected according to a predetermined criterion from among the posted information acquired by the acquisition unit 131. Specifically, the generation unit 134 generates the posted information selected by the selection unit 132 as a summary. For example, in the example of FIG. 6, the generation unit 134 generates the posted information “XXXX wins the presidential election” selected by the selection unit 132 as a summary. Note that the generation unit 134 may generate the summary by appropriately editing the posted information selected by the selection unit 132. For example, the person's name "XXXX" and the related word "winning" are left, and other characters are shortened.
提供部135は、生成部134によって生成された要約をユーザに提供する。例えば、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に、プッシュ通知やリアルタイム検索等の技術により生成部134によって生成された要約をユーザに提供する。また、提供部135は、生成部134によって生成された要約のうち、算出部133によって算出された関連度が最も大きい要約をユーザに提供してもよい。なお、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に、生成部134によって生成された要約をユーザに提供してもよい。
The providing
〔1-3.算出装置による算出処理手順の一例を示すフローチャート〕
次に、図7を用いて、第1の実施形態に係る算出装置100による算出処理手順の一例の手順について説明する。図7は、第1の実施形態に係る実施形態に係る算出装置100による算出処理手順を示すフローチャートである。
[1-3. Flowchart showing an example of calculation processing procedure by calculation device]
Next, an example of a calculation processing procedure by the
図7に示すように、取得部131は、外部装置10から、ユーザによって投稿された投稿情報を取得する(ステップS101)。そして、選択部132は、取得部131によって取得された投稿情報に人名と関連語とがともに含まれる場合に、人名と関連語との位置の近さに基づいて投稿情報を選択する(ステップS102)。そして、算出部133は、選択部132によって選択された投稿情報において人名と関連語との関連度を算出する(ステップS103)。そして、生成部134は、選択部132によって選択された人名と関連語との位置が最も近い投稿情報を要約として生成する(ステップS104)。そして、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に(ステップS105;Yes)、生成部134によって生成された要約をユーザに提供する(ステップS106)。一方、提供部135は、算出部133によって算出された関連度が所定の閾値より小さい場合に(ステップS105;No)、ステップS102の処理の前まで戻る。
As shown in FIG. 7, the acquisition unit 131 acquires posted information posted by a user from the external device 10 (step S101). Then, when the posted information acquired by the acquisition unit 131 includes both a person's name and a related word, the selection unit 132 selects the posted information based on the proximity of the position of the person's name and the related word (step S102 ). Then, the calculation unit 133 calculates the degree of association between a person's name and a related word in the posted information selected by the selection unit 132 (step S103). Then, the generation unit 134 generates posted information in which the position of the person's name selected by the selection unit 132 and the related word are closest to each other as a summary (step S104). Then, when the degree of association calculated by the calculation unit 133 is greater than or equal to a predetermined threshold (step S105; Yes), the
このように、第1の実施形態に係る算出装置100は、外部装置10から取得された投稿情報に含まれる人名と関連語との位置の近さに基づいて、人名と関連語との位置が最も近い投稿情報を選択する。そして、算出装置100は、投稿情報に含まれる人名と関連語との関連度を算出する。これにより、第1の実施形態に係る算出装置100は、人名と関連語との位置の近さに基づいて選択された投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
In this way, the
〔2.第2の実施形態〕
〔2-1.算出装置の情報処理の一例〕
次に、第2の実施形態について説明する。上述してきた第1の実施形態では、算出装置100は、人名と関連語とがともに含まれる投稿情報に対する算出処理の一例を説明した。第2の実施形態では、算出装置200が、人名と関連語とがともに含まれない投稿情報に対する算出処理の例を示す。なお、第2の実施形態では、第1の実施形態と同様の構成について同一の符号を付して説明を省略する。
[2. Second embodiment]
[2-1. Example of information processing of calculation device]
Next, a second embodiment will be described. In the first embodiment described above, the
図8を用いて、第2の実施形態に係る算出処理の一例について説明する。図8は、第2の実施形態に係る算出処理の一例を示す図である。図8では、算出装置200により算出処理が実行される例を示す。
An example of the calculation process according to the second embodiment will be described using FIG. 8. FIG. 8 is a diagram illustrating an example of calculation processing according to the second embodiment. FIG. 8 shows an example in which calculation processing is executed by the
図8に示すように、算出システム2は、外部装置10と、端末装置20と、算出装置200とを含む。外部装置10、端末装置20及び算出装置200は、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図8に示す算出システム2には、複数台の外部装置10や、複数台の端末装置20や、複数台の算出装置200が含まれてもよい。
As shown in FIG. 8, the
第2の実施形態に係る外部装置10は、第1の実施形態に係る外部装置10と同様の構成であるため、説明を省略する。
The
第2の実施形態に係る端末装置20は、第1の実施形態に係る端末装置20と同様の構成であるため、説明を省略する。
The
第2の実施形態に係る算出装置200は、外部装置10から取得された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する。
The
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、算出装置200は、外部装置10から取得された投稿情報に「XXXX」と「当選」とが含まれない場合に、文長情報と出現頻度とに基づいて「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを選択する。続いて、算出装置200は、「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを組み合わせた投稿情報における「XXXX」と「当選」との関連度を算出する。そして、算出装置200は、「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する。
For example, assume that a person's name is "XXXX" and the related word related to the person's name is the sa-bun noun "election." In this case, when the posted information acquired from the
以下、図8を用いて、算出装置200によるユーザによって投稿された投稿情報における文長情報と出現頻度に基づいて、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する算出処理の一例を流れに沿って説明する。
Hereinafter, using FIG. 8, posted information that combines posted information containing only a person's name and posted information containing only related words based on sentence length information and appearance frequency in posted information posted by a user by the
まず、図8に示すように、算出装置200は、ユーザによって投稿された投稿情報を外部装置10から取得する(ステップS21)。そして、算出装置200は、ユーザによって投稿された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する(ステップS22)。
First, as shown in FIG. 8, the
例えば、図8の例では、投稿情報ST34の文長情報は11文字であり、投稿情報ST35の文長情報は12文字であり、投稿情報ST36の文長情報は20文字である。そして、投稿情報ST34の人名「XXXX」の出現頻度は1回であり、投稿情報ST35の人名「XXXX」の出現頻度は1回であり、投稿情報ST36の人名「XXXX」の出現頻度は1回である。これより、算出装置200は、以下のような式(1)によりスコアSCを算出する。
For example, in the example of FIG. 8, the sentence length information of posted information ST34 is 11 characters, the sentence length information of posted information ST35 is 12 characters, and the sentence length information of posted information ST36 is 20 characters. The appearance frequency of the person's name "XXXX" in posted information ST34 is once, the appearance frequency of the person's name "XXXX" in posted information ST35 is once, and the appearance frequency of the person's name "XXXX" in posted information ST36 is once. It is. From this, the
スコアSC = w1*x+w2*y ・・・ (1) Score SC = w1*x+w2*y... (1)
上記式(1)では、「w1」は、任意の重みを示し、「x」は、文長情報に関する関数を示し、「w2」は、任意の重みを示し、「y」は、出現頻度に関する関数を示す。そして、算出装置200は、スコアSCが最も大きい投稿情報ST36を人名のみを含む投稿情報として選択する。
In the above formula (1), "w1" indicates an arbitrary weight, "x" indicates a function related to sentence length information, "w2" indicates an arbitrary weight, and "y" indicates a function related to appearance frequency. Indicates a function. Then, the
算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する(ステップS23)。例えば、算出装置200は、KNPやCaboCha等の係り受け解析を用いて、投稿情報ST36「XXXXがAA党から出馬し、大統領に勝利」と投稿情報ST33「ZZZ国の大統領に当選」を組み合わせた投稿情報「XXXXがAA党から出馬、大統領に勝利し、ZZZ国の大統領に当選」における人名「XXXX」と関連語「当選」との関連度を90%として算出する。
The
そして、算出装置200は、関連度が所定の閾値以上である場合に、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約としてユーザに提供する(ステップS24)。
Then, when the degree of association is greater than or equal to a predetermined threshold, the
このように、算出装置200は、文長情報と出現頻度とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。これにより、算出装置200は、文長情報と出現頻度とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
In this way, the
〔2-2.決定装置の構成〕
次に、図9を用いて、第2の実施形態に係る算出装置200の構成について説明する。図9は、第2の実施形態に係る算出装置200の構成例を示す図である。図9に示すように、算出装置200は、通信部110と、記憶部220と、制御部230とを有する。
[2-2. Configuration of decision device]
Next, the configuration of the
記憶部220は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部220は、投稿情報記憶部221と、関連度情報記憶部122と、要約情報記憶部123とを有する。
The storage unit 220 is realized by, for example, a semiconductor memory device such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 220 includes a posted
第2の実施形態に係る投稿情報記憶部221は、ユーザによって投稿された投稿情報を記憶する。ここで、図10に、第2の実施形態に係る投稿情報記憶部221の一例を示す。図10に示した例では、投稿情報記憶部221は、「順位」、「投稿情報」、「文長情報」、「出現頻度」、「スコア」といった項目を有する。
The posted
「順位」は、文長情報と出現頻度とに基づいて順位付される投稿情報の順位を示す。「投稿情報」は、ユーザによって投稿される投稿内容を示す。「文長情報」は、投稿情報の文字数の長さを示す。「出現頻度」は、人名あるいは関連語が投稿情報中に出現する頻度を示す。「スコア」は、式(1)により文長情報と出現頻度とに基づいて算出されるスコアを示す。例えば、図10の例では、「XXXX」のみを含む投稿情報の順位を示す。図10に示すように、ユーザU1が投稿した投稿情報PO1である「XXXXがAA党から出馬し、大統領に勝利」は、式(1)により算出されたスコアが92と最も大きい値を示すため、順位が「1」であることを示す。 "Ranking" indicates the ranking of posted information based on sentence length information and frequency of appearance. "Posted information" indicates posted content posted by a user. "Sentence length information" indicates the length of the posted information in characters. "Frequency of appearance" indicates the frequency with which a person's name or related word appears in posted information. "Score" indicates a score calculated based on sentence length information and appearance frequency using equation (1). For example, the example in FIG. 10 shows the ranking of posted information that includes only "XXXX". As shown in FIG. 10, the posted information PO1 posted by user U1, "XXXX ran for president from the AA party," has the largest score of 92 calculated by formula (1). , indicates that the rank is "1".
制御部230は、コントローラであり、例えば、CPUやMPU等によって、算出装置200内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部230は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。
The
図9に示すように、制御部230は、取得部131と、選択部232と、算出部233と、生成部234と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部230の内部構成は、図9に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部230が有する各処理部の接続関係は、図9に示した接続関係に限られず、他の接続関係であってもよい。
As shown in FIG. 9, the
選択部232は、取得部131によって取得された第1投稿情報(人名を含む投稿情報に相当)のうち文字数に基づいて人名を含む投稿情報を選択し、第2投稿情報(関連語を含む投稿情報に相当)のうち文字数に基づいて関連語を含む投稿情報を選択する。また、選択部232は、取得部131によって取得された人名を含む投稿情報のうち人名が出現する頻度に基づいて人名を含む投稿情報を選択し、関連語を含む投稿情報のうち関連語が出現する頻度に基づいて関連語を含む投稿情報を選択する。具体的には、選択部232は取得部131によって取得された投稿情報に人名のみあるいは関連語のみが含まれる場合に、文長情報と出現頻度に基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する。 The selection unit 232 selects posted information that includes a person's name based on the number of characters from the first posted information (corresponding to posted information that includes a person's name) acquired by the acquisition unit 131, and selects posted information that includes a person's name based on the number of characters, and selects the second posted information (posts that include related words). Select posted information that includes related words based on the number of characters (equivalent to information). Further, the selection unit 232 selects posted information including a person's name based on the frequency of appearance of the person's name among the posted information including the person's name acquired by the acquisition unit 131, and selects posted information including a person's name from among the posted information including a related term. Select posts that contain related terms based on their frequency. Specifically, when the posted information acquired by the acquisition unit 131 includes only a person's name or only related words, the selection unit 232 selects posted information containing only the person's name and only related words based on sentence length information and appearance frequency. Select post information including.
例えば、図10の例では、選択部232は、取得部131によって取得された投稿情報に「XXXX」のみが含まれる場合に、文長情報と出現頻度とに基づいて「XXXX」のみを含む投稿情報として投稿情報「XXXXがAA党から出馬し、大統領に勝利」を選択する。 For example, in the example of FIG. 10, when the posted information acquired by the acquisition unit 131 includes only “XXXX”, the selection unit 232 selects a post that includes only “XXXX” based on the sentence length information and the appearance frequency. Select the posted information ``XXXX ran for president from the AA party and won for president'' as the information.
算出部233は、取得部131によって取得された投稿情報に基づいて、人名と、人名と関連する関連語との関連度を算出する。具体的には、算出部233は、取得部131によって取得された投稿情報のうち、人名と関連語とが含まれない場合に、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。例えば、図8の例では、算出部233は、選択部232によって選択された人名と関連語とを含む投稿情報を組み合わせた投稿情報において、KNPやCaboCha等の係り受け解析を用いて、人名「XXXX」と関連語「当選」との関連度を90%として算出する。
The
生成部234は、選択部232によって選択された人名を含む投稿情報と関連語を含む投稿情報とを組み合わせた投稿情報を要約として生成する。例えば、図8の例では、生成部234は、選択部232によって選択された投稿情報「XXXXがAA党から出馬し、大統領に勝利」と投稿情報「ZZZ国の大統領に当選」を組み合わせた投稿情報「XXXXがAA党から出馬し、大統領に勝利し、ZZZ国の大統領に当選」を要約として生成する。なお、生成部234は、選択部232によって選択された人名を含む投稿情報と関連語を含む投稿情報とを組み合わせた投稿情報を適宜編集することで、要約を生成してもよい。
The
〔2-3.算出装置による算出処理手順の一例を示すフローチャート〕
次に、図11を用いて、第2の実施形態に係る算出装置200による算出処理手順の一例の手順について説明する。図11は、第2の実施形態に係る算出装置200による算出処理手順を示すフローチャートである。
[2-3. Flowchart showing an example of calculation processing procedure by calculation device]
Next, an example of a calculation processing procedure by the
図11に示すように、取得部131は、外部装置10から、ユーザによって投稿された投稿情報を取得する(ステップS201)。選択部232は、取得部131によって取得された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する(ステップS202)。そして、算出部233は、選択部232によって選択された人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する(ステップS203)。そして、生成部234は、選択部232によって選択された人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する(ステップS204)。そして、提供部135は、算出部233によって算出された関連度が所定の閾値以上である場合に(ステップS205;Yes)、生成部234によって生成された要約をユーザに提供する(ステップS206)。一方、提供部135は、算出部233によって算出された関連度が所定の閾値より小さい場合に(ステップS205;No)、ステップS202の処理の前まで戻る。
As shown in FIG. 11, the acquisition unit 131 acquires posted information posted by a user from the external device 10 (step S201). When the posted information acquired by the acquiring unit 131 does not include a person's name and related words, the selection unit 232 selects posted information that includes only the person's name and posts that only include related words based on sentence length information and appearance frequency. information (step S202). Then, the
このように、算出装置200は、文長情報と出現頻度とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。これにより、算出装置200は、文長情報と出現頻度とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
In this way, the
〔3.変形例〕
上述した算出装置100又200は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、算出装置100又200の他の実施形態について説明する。
[3. Modified example]
The
〔3-1.算出装置〕
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、第1の実施形態に係る算出装置100は、第2の実施形態で説明した算出処理を行い、第2の実施形態に係る算出装置200は、第1の実施形態で説明した算出処理を行ってもよい。
[3-1. Calculation device]
Each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured. For example, the
〔3-2.キーワード情報〕
上記実施形態において、算出装置100又200の選択部132又232は、上述では人名と人名に関連する関連語とを含む投稿情報を選択すると説明してきたが、人名に限らず、他の名詞を選択してもよい。例えば、選択部132又232は、人名ではない固有名詞(例えば、ゲームの名前やスポーツの名前など)とかかる固有名詞に関連する関連語とを含む投稿情報を選択してもよい。
[3-2. Keyword information〕
In the above embodiment, it has been explained above that the selection unit 132 or 232 of the
〔3-3.関連語〕
上記実施形態において、算出装置100又200の選択部132又232は、上述では人名と人名に関連する関連語としてサ変名詞とを含む投稿情報を選択すると説明してきたが、サ変名詞に限らず、名詞等を選択してもよい。例えば、選択部132又232は、人名とサ変名詞ではない動詞(例えば、行うや選ぶなど)とを含む投稿情報を選択してもよい。
[3-3. Related words〕
In the embodiment described above, it has been explained that the selection unit 132 or 232 of the
〔3-4.選択処理〕
上記実施形態において、算出装置200の選択部232は、取得部131によって取得された人名および関連語以外の第3キーワード情報(共通語に相当)がともに出現する人名を含む投稿情報と関連語を含む投稿情報とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択してもよい。具体的には、算出装置200の選択部232は、取得部131によって取得された人名を含む投稿情報と関連語を含む投稿情報において文長情報と出現頻度と人名を含む投稿情報と関連語を含む投稿情報とに共通に含まれるキーワード情報を示す共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択してもよい。
[3-4. Selection process]
In the embodiment described above, the selection unit 232 of the
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「勝利」であるとする。この場合、選択部232は、文長情報と出現頻度と共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。図12の例では、投稿情報テーブルT1には、人名「XXXX」のみを含む投稿情報において、文長情報と出現頻度とに基づいて順位付された投稿情報が示されている。また、投稿情報テーブルT2には、関連語「勝利」のみを含む投稿情報において、文長情報と出現頻度とに基づいて順位付された投稿情報が示されている。図12に示すように、選択部232は、人名を含む投稿情報として、投稿情報テーブルT1から共通語である「AA党」を含む投稿情報「XXXXがAA党から大統領選に出馬」を選択する。また、選択部232は、関連語を含む投稿情報として、投稿情報テーブルT2から投稿情報「AA党が大統領選に勝利」を選択する。 For example, assume that a person's name is "XXXX" and the related word related to the person's name is the sa-noun "sho". In this case, the selection unit 232 selects the posted information including the person's name and the posted information including the related word based on the sentence length information, the frequency of appearance, and the common word. In the example of FIG. 12, the posted information table T1 shows posted information that includes only the person's name "XXXX" and is ranked based on sentence length information and appearance frequency. Further, the posted information table T2 shows posted information that includes only the related word "victory" and is ranked based on sentence length information and frequency of appearance. As shown in FIG. 12, the selection unit 232 selects posted information "XXXX is running for president from the AA Party" that includes the common word "AA Party" from the posted information table T1 as the posted information that includes a person's name. . Further, the selection unit 232 selects the posted information "AA party wins the presidential election" from the posted information table T2 as the posted information including the related term.
このように、選択部232は、文長情報と出現頻度と共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。これにより、算出装置200は、文長情報と出現頻度と共通語とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、人名と関連語とが同一の投稿情報に含まれていない場合であっても、キーワード情報同士の関連度を高精度で算出することができる。
In this manner, the selection unit 232 selects posted information including a person's name and posted information including a related word based on sentence length information, frequency of appearance, and common words. Thereby, the
〔4.ハードウェア構成〕
また、上述してきた実施形態に係る外部装置10、端末装置20、算出装置100又は200は、例えば図13に示すような構成のコンピュータ1000によって実現される。以下、算出装置100を例に挙げて説明する。図13は、算出装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[4. Hardware configuration]
Further, the
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100がネットワークNを介して生成したデータを他の機器へ送信する。
The
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
The
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る算出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
For example, when the
〔5.効果〕
上述してきたように、実施形態に係る算出装置100は、取得部131と、算出部133とを有する。取得部131は、ユーザによって投稿される投稿情報を取得する。算出部133は、取得部131によって取得された投稿情報に基づいて、第1キーワード情報(人名に相当)と、第1キーワード情報と関連する第2キーワード情報(関連語に相当)との関連度を算出する。
[5. effect〕
As described above, the
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報に基づいて注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
Thereby, the
また、実施形態に係る算出装置100において、算出部133は、取得部131によって取得された投稿情報のうち、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報に基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
In addition, in the
また、実施形態に係る算出装置100において、算出部133は、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報のうち、第1キーワード情報と第2キーワード情報との位置の近さに基づいて選択された投稿情報に基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
In addition, in the
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれている投稿情報において、注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
As a result, the
また、実施形態に係る算出装置100において、算出部133は、取得部131によって取得された投稿情報のうち、第1キーワード情報を含む第1投稿情報(人名のみを含む投稿情報)と第2キーワード情報を含む第2投稿情報(関連語のみを含む投稿情報)とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
In addition, in the
また、実施形態に係る算出装置100において、算出部133は、第1投稿情報のうち文字数に基づいて選択された第1投稿情報と、第2投稿情報のうち文字数に基づいて選択された第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
In addition, in the
また、実施形態に係る算出装置100において、算出部133は、第1投稿情報のうち第1キーワード情報が出現する頻度に基づいて選択された第1投稿情報と、第2投稿情報のうち第2キーワード情報が出現する頻度に基づいて選択された第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
In addition, in the
また、実施形態に係る算出装置100において、算出部133は、第1キーワード情報および第2キーワード情報以外の第3キーワード情報がともに出現する第1投稿情報と第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
Further, in the
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれていない投稿情報において、注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
As a result, the
また、実施形態に係る算出装置100は、取得部131によって取得された投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成する生成部134をさらに備える。
The
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
As a result, the
また、実施形態に係る算出装置100において、生成部134は、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報のうち、第1キーワード情報と第2キーワード情報との位置の近さに基づいて選択された投稿情報に基づいて、要約を生成する。
In addition, in the
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれている投稿情報において、注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
As a result, the
また、実施形態に係る算出装置100において、生成部134は、第1投稿情報のうち文字数に基づいて選択された第1投稿情報と、第2投稿情報のうち文字数に基づいて選択された第2投稿情報とに基づいて、要約を生成する。
In addition, in the
また、実施形態に係る算出装置100において、生成部134は、第1投稿情報のうち第1キーワード情報が出現する頻度に基づいて選択された第1投稿情報と、第2投稿情報のうち第2キーワード情報が出現する頻度に基づいて選択された第2投稿情報とに基づいて、要約を生成する。
In addition, in the
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれていない投稿情報において、注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
As a result, the
上述してきたように、実施形態に係る算出装置100は、取得部131と、生成部134とを有する。取得部131は、ユーザによって投稿される投稿情報を取得する。算出部133は、取得部131によって取得された投稿情報に基づいて、第1キーワード情報と、第1キーワード情報と関連する第2キーワード情報とを含む要約を生成する。
As described above, the
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報に基づいて注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
As a result, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Some of the embodiments of the present application have been described above in detail based on the drawings, but these are merely examples, and various modifications and variations may be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to carry out the invention in other forms with modifications.
1 算出システム
2 算出システム
10 外部装置
20 端末装置
100 算出装置
110 通信部
120 記憶部
121 投稿情報記憶部
122 関連度情報記憶部
123 要約情報記憶部
130 制御部
131 取得部
132 選択部
133 算出部
134 生成部
135 提供部
200 算出装置
220 記憶部
221 投稿情報記憶部
230 制御部
232 選択部
233 算出部
234 生成部
1
Claims (3)
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択部と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出部と、
選択された前記投稿情報に基づいて要約を生成する生成部と、
前記算出部によって算出された関連度が所定の閾値以上である場合に、生成された前記要約をユーザに提供する提供部と
を備えたことを特徴とする算出装置。 an acquisition unit that acquires a plurality of posted information posted by users, including both first keyword information and second keyword information related to the first keyword information;
a selection unit that selects posted information in which the first keyword information and the second keyword information are closest in position from among the plurality of posted information based on the proximity of the positions of the first keyword information and the second keyword information; and,
a calculation unit that calculates a degree of association based on a dependency relationship between a first keyword indicated by the first keyword information included in the selected posted information and a second keyword indicated by the second keyword information;
a generation unit that generates a summary based on the selected posted information;
A calculation device comprising: a provision unit that provides the generated summary to a user when the degree of association calculated by the calculation unit is equal to or greater than a predetermined threshold.
ユーザによって投稿される投稿情報であって、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との双方を含む複数の投稿情報を取得する取得工程と、
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択工程と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出工程と、
選択された前記投稿情報に基づいて要約を生成する生成工程と、
前記算出工程によって算出された関連度が所定の閾値以上である場合に、生成された前記要約をユーザに提供する提供工程と
を含むことを特徴とする算出方法。 A calculation method performed by a computer,
an acquisition step of acquiring a plurality of pieces of posted information posted by users, including both first keyword information and second keyword information related to the first keyword information;
a selection step of selecting posted information in which the first keyword information and the second keyword information are closest in position from among the plurality of posted information based on the proximity of the positions of the first keyword information and the second keyword information; and,
a calculation step of calculating a degree of association based on a dependency relationship between a first keyword indicated by the first keyword information included in the selected posted information and a second keyword indicated by the second keyword information;
a generation step of generating a summary based on the selected posted information ;
and a providing step of providing the generated summary to a user when the degree of association calculated in the calculating step is equal to or greater than a predetermined threshold.
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択手順と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出手順と、
選択された前記投稿情報に基づいて要約を生成する生成手順と、
前記算出手順によって算出された関連度が所定の閾値以上である場合に、生成された前記要約をユーザに提供する提供手順と
をコンピュータに実行させることを特徴とする算出プログラム。 an acquisition procedure of acquiring a plurality of posted information posted by users, including both first keyword information and second keyword information related to the first keyword information;
A selection procedure of selecting posted information in which the first keyword information and the second keyword information are closest in position from among the plurality of posted information based on the proximity of the positions of the first keyword information and the second keyword information. and,
a calculation step of calculating a degree of association based on a dependency relationship between a first keyword indicated by the first keyword information included in the selected posted information and a second keyword indicated by the second keyword information;
a generation step of generating a summary based on the selected posted information;
A calculation program that causes a computer to execute a providing step of providing the generated summary to a user when the degree of association calculated by the calculation step is greater than or equal to a predetermined threshold.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017166532A JP7388617B2 (en) | 2017-08-31 | 2017-08-31 | Calculation device, calculation method and calculation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017166532A JP7388617B2 (en) | 2017-08-31 | 2017-08-31 | Calculation device, calculation method and calculation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019046016A JP2019046016A (en) | 2019-03-22 |
JP7388617B2 true JP7388617B2 (en) | 2023-11-29 |
Family
ID=65814403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017166532A Active JP7388617B2 (en) | 2017-08-31 | 2017-08-31 | Calculation device, calculation method and calculation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7388617B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012155695A (en) | 2011-01-07 | 2012-08-16 | Kddi Corp | Program for imparting keyword tag to scene of interest in motion picture contents, terminal, server, and method |
WO2012111226A1 (en) | 2011-02-15 | 2012-08-23 | 日本電気株式会社 | Time-series document summarization device, time-series document summarization method and computer-readable recording medium |
JP2016110213A (en) | 2014-12-02 | 2016-06-20 | シャープ株式会社 | Information processing device, information processing system, terminal device, information processing method, and information processing program |
-
2017
- 2017-08-31 JP JP2017166532A patent/JP7388617B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012155695A (en) | 2011-01-07 | 2012-08-16 | Kddi Corp | Program for imparting keyword tag to scene of interest in motion picture contents, terminal, server, and method |
WO2012111226A1 (en) | 2011-02-15 | 2012-08-23 | 日本電気株式会社 | Time-series document summarization device, time-series document summarization method and computer-readable recording medium |
JP2016110213A (en) | 2014-12-02 | 2016-06-20 | シャープ株式会社 | Information processing device, information processing system, terminal device, information processing method, and information processing program |
Non-Patent Citations (8)
Title |
---|
佐々木 智,取るべき行動と理由を提示するヘルプデスク指向の質問応答システム,第2回データ工学と情報マネジメントに関するフォーラム-DEIM 2010-論文集[online],電子情報通信学会データ工学研究専門委員会,2010年05月25日,Internet<URL:http://db-event.jpn.org/deim2010/proceedings/files/A8-5.pdf> |
新田 直子,単語間の関係性の経時変化を考慮したマイクロブログからの実世界観測情報の抽出,日本データベース学会和文論文誌,日本データベース学会,2014年10月31日,第13-J巻 第1号,pp.7~12 |
松本 悠,強化学習を用いた文圧縮手法,言語処理学会第22回年次大会 発表論文集 [online],言語処理学会,2016年02月29日,pp.465~468,Internet<URL:http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/P11-5.pdf> |
池田 諭史,機能語の補完を用いた濃縮還元型要約モデル,言語処理学会第13回年次大会発表論文集,言語処理学会,2007年03月19日,pp.1152~1155 |
田島 真悟,短期持続型情報要求のためのTwitter上でのアドホックなフォローネットワーク構成手法,第5回データ工学と情報マネジメントに関するフォーラム(第11回日本データベース学会年次大会)[online],電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2013年05月31日,Internet<URL:http://db-event.jpn.org/deim2013/proceedings/pdf/b1-5.pdf> |
藤村 春輝,電子投票のための意思決定支援システムにおけるアンケート作成支援システムの試み,第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [online],電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2017年2月27日,[2017年7月6日検索]Internet<URL:http://db-event.jpn.org/deim2017/papers/2.pdf> |
野畑 周,複数記事に対する要約や情報抽出に関する一考察,言語処理学会第8回年次大会発表論文集,言語処理学会,2002年03月18日,pp.547~550 |
黒橋 禎夫,「知能コンピューティングとその周辺」〔第4回〕言語コンピューティング,人工知能学会誌,(社)人工知能学会,2007年09月01日,第22巻 第5号,pp.711~718 |
Also Published As
Publication number | Publication date |
---|---|
JP2019046016A (en) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107480158B (en) | Method and system for evaluating matching of content item and image based on similarity score | |
US9720913B1 (en) | Automatic generation of snippets based on context and user interest | |
US8793259B2 (en) | Information retrieval device, information retrieval method, and program | |
US20160012122A1 (en) | Automatically linking text to concepts in a knowledge base | |
JP6966158B2 (en) | Methods, devices and programs for processing search data | |
US20160012045A1 (en) | User interface for summarizing the relevance of a document to a query | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
JP4942727B2 (en) | Text summarization apparatus, method and program thereof | |
JP2010033197A (en) | Search device using disclosed search engine, search method, and search program | |
JP6165955B1 (en) | Method and system for matching images and content using whitelist and blacklist in response to search query | |
Alas et al. | The rapidly increasing usefulness of social media in urogynecology | |
Datta et al. | Mobilewalla: A mobile application search engine | |
Hundt | The committee has/have decided... On concord patterns with collective nouns in inner-and outer-circle varieties of English | |
US8838580B2 (en) | Method and system for providing keyword ranking using common affix | |
Cortelazzo et al. | Improving Labbé’s intertextual distance: testing a revised version on a large corpus of Italian literature | |
US20140188861A1 (en) | Using scientific papers in web search | |
Baeza-Yates et al. | The new frontier of web search technology: Seven challenges | |
CN108304421B (en) | Information searching method and device | |
JP5952343B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM | |
US20030195882A1 (en) | Homepage searching method using similarity recalculation based on URL substring relationship | |
JP7388617B2 (en) | Calculation device, calculation method and calculation program | |
Vargas et al. | Term-by-term query auto-completion for mobile search | |
JP5699744B2 (en) | SEARCH METHOD, SEARCH DEVICE, AND COMPUTER PROGRAM | |
JP2010055164A (en) | Sentence retrieval device, sentence retrieval method, sentence retrieval program and its storage medium | |
JP2016076097A (en) | Behavior prediction apparatus, behavior prediction method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220117 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220913 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220913 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220927 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20221004 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20221125 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20221129 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221213 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230104 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230731 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20231026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7388617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |