WO2021117483A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
WO2021117483A1
WO2021117483A1 PCT/JP2020/043736 JP2020043736W WO2021117483A1 WO 2021117483 A1 WO2021117483 A1 WO 2021117483A1 JP 2020043736 W JP2020043736 W JP 2020043736W WO 2021117483 A1 WO2021117483 A1 WO 2021117483A1
Authority
WO
WIPO (PCT)
Prior art keywords
tag
information processing
document
content
rule
Prior art date
Application number
PCT/JP2020/043736
Other languages
English (en)
French (fr)
Inventor
将樹 濱田
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Publication of WO2021117483A1 publication Critical patent/WO2021117483A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Definitions

  • This technology is particularly related to information processing devices, information processing methods, and programs that enable flexible structuring of document contents.
  • Patent Document 1 discloses a technique for specifying a logical structure using a tag in a markup language as a clue, or specifying a logical structure using a delimiter such as a line feed, a colon, or a hyphen as a clue.
  • Patent Document 2 discloses a technique of accepting data input in the form of a question and an answer and structuring the input data.
  • Patent Document 1 cannot be applied to a document that does not meet certain rules.
  • Patent Document 2 is data in which the input data is pre-structured in the form of questions and answers, and cannot be applied to general documents other than such structured data.
  • This technology was made in view of such a situation, and makes it possible to flexibly structure the contents of the document.
  • the information processing device of one aspect of the present technology attaches a tag representing the content of the first part to the first part of the part constituting the document that meets the predetermined rule according to the rule.
  • an information processing unit that assigns a tag representing the content of the second part to the second part that does not meet the rule according to a statistical method.
  • a tag indicating the content of the first part is attached to the first part of the part constituting the document that applies to the predetermined rule according to the rule, and the tag does not apply to the rule.
  • a tag representing the content of the second part is added according to a statistical method.
  • FIG. 1 is a diagram showing a tagging function according to an embodiment of the present technology.
  • a document tagging application 11 is installed in an information processing device 1 such as a PC.
  • the document tagging application 11 realizes a tagging function of assigning a tag as attribute information representing the content to a target document.
  • the document to be processed by the document tagging application 11 includes a plurality of sentences.
  • a tag indicating the content of each paragraph is added to each paragraph as shown at the tip of the arrow in FIG.
  • a tag indicating the logical structure (position in the logical flow) of each paragraph in the document is added.
  • the document tagging application 11 outputs information about the tagged document or the tag such as what kind of tag is attached to each paragraph.
  • the tag given by the document tag giving application 11 is presented to the user, for example, when reading a document.
  • the user can quickly understand the contents of the document by reading the document while referring to the tags and checking what kind of contents are described in each paragraph.
  • the document tagging application 11 clarifies the logical flow of a document including sentences, and realizes a system that helps understanding when reading the document.
  • FIG. 2 is a diagram showing an example of tagging.
  • Such materials include, for example, "PowerPoint” materials (ppt files) provided by Microsoft Corporation (trademark). It is possible to add tags to various data including sentences.
  • the type of tag to be attached is preset according to the type of the target document. Different types of tags may be assigned to each document category, each creator, each creation date, and each user who is a reader.
  • tagging is performed according to a tagging rule, which is a predetermined rule, and tagging is performed by a statistical method.
  • step S1 the document tagging application 11 divides the target sentence. A tag is attached to each divided part.
  • step S2 the document tagging application 11 pays attention to each part to which the tag is attached, and determines whether or not the tagging rule is applied. If it is determined that the tagging rule is applied, the process proceeds to step S3, and if it is determined that the tagging rule is not applied, the process proceeds to step S4.
  • step S3 the document tagging application 11 assigns tags to the parts that apply to the tagging rules according to the tagging rules.
  • step S4 the document tagging application 11 assigns tags to parts that do not meet the tagging rules by a statistical method. For example, tags are added (inferred) using a neural network inference model generated in advance by machine learning.
  • FIG. 4 is a block diagram showing a functional configuration example of the tagging processing unit 21. At least a part of the functional units shown in FIG. 4 is realized by executing the document tagging application 11 by the CPU of the information processing device 1.
  • the tag addition processing unit 21 as an information processing unit includes a text division unit 31, a rule-based tag addition unit 32, a word division unit 33, a vectorization processing unit 34, an inference unit 35, and a model learning unit. It is composed of 36.
  • the target document is input to the text segment 31.
  • the text segmentation unit 31 divides the input document according to the division for each part that is the unit of tagging. Paragraphs, page breaks, blank lines, and other delimiters are set in the target document.
  • the process of step S1 in FIG. 3 is a process performed by the text segmentation unit 31.
  • the divided sentences composed of sentences such as paragraph units and slide units divided by the text segmentation unit 31 are supplied to the rule-based tagging unit 32.
  • the subsequent processing is performed in parallel for each divided sentence. Since the processing for each divided sentence is performed in parallel and independently, which tag is attached to one divided sentence has nothing to do with other divided sentences.
  • the rule-based tagging unit 32 determines whether or not the divided sentence applies to the tagging rule.
  • the process of step S2 in FIG. 3 is a process performed by the rule-based tagging unit 32.
  • FIG. 5 is a diagram showing an example of a tagging rule.
  • tags of "title”, “problem”, “solution”, “result”, “other”, and “summary” are shown as the types of tags.
  • the "Other” tags include "Self-introduction,” “Table of Contents,” “Schedule,” “Supplementary Materials,” and “Other.”
  • the tagging rule shown in FIG. 5 is a rule used when a material composed of a plurality of slides is targeted.
  • the "title” tag is a tag given to the first page of the slide.
  • the "task” tag is a tag attached to a slide of a title containing the characters "task”.
  • the “solution” tag is a tag attached to a slide of a title containing the characters "solution” or "approach”.
  • the "result” tag is a tag attached to a slide of a title containing the characters "result”.
  • the "self-introduction” tag included in the “other” tag is a tag given to a slide of a title containing the characters “self-introduction”, “career”, or "biography”.
  • the "table of contents” tag included in the “other” tag is a tag attached to a slide of a title containing the characters “table of contents”, “mokuji”, “agenda”, or “agenda”. Slides whose title matches “Presentation Flow”, “Content”, “Summary”, “contents”, “Outline”, or “outline” are also tagged with "Table of Contents”.
  • the "schedule” tag included in the “other” tag is a tag attached to a slide of a title containing the characters "schedule” or "schedule”.
  • the "supplementary material” tag included in the “other” tag is a tag attached to all pages after the page to which the "summary" tag is attached.
  • the "summary" tag is a tag attached to a slide of a title containing the characters "summary”.
  • Such tagging rules are preset for each type of target document.
  • the rule-based tagging unit 32 attaches a tag according to the tagging rule and outputs it when the input divided sentence applies to the tagging rule.
  • the "problem" tag is added as shown at the tip of the arrow A1.
  • the process of step S3 in FIG. 3 is a process performed by the rule-based tagging unit 32.
  • the rule-based tagging unit 32 outputs the divided sentence to the word dividing unit 33 when the input divided sentence does not apply to the tagging rule.
  • the divided sentence that does not meet the tagging rule, which is output to the word dividing unit 33, is a part to be tagged by using a statistical method.
  • the word dividing unit 33 divides the sentences constituting the divided sentences supplied from the rule-based tagging unit 32 into words. Various tools can be used for word splitting.
  • the divided sentence divided into words by the word dividing unit 33 is supplied to the vectorization processing unit 34.
  • the vectorization processing unit 34 vectorizes the divided sentences supplied from the word division unit 33. For vectorization of the divided sentences, for example, a method using the frequency of words, a method such as word2vec is used. The vector data representing the characteristics of the divided sentence is supplied to the inference unit 35. Note that the vectorization processing unit 34 vectorizes the divided sentences when the input of the inference model used in the inference unit 35 is a vectorized sentence.
  • the inference unit 35 inputs the vector data supplied from the vectorization processing unit 34 into the inference model, and outputs a tag to be added to the divided sentence.
  • the "solution" tag is attached as shown at the tip of the arrow A2.
  • the process of step S4 in FIG. 3 is a process performed by the inference unit 35.
  • the model learning unit 36 performs machine learning using sentence data prepared as learning data, and generates an inference model used by the inference unit 35.
  • the learning of the inference model by the model learning unit 36 is performed, for example, by using the sentence data for learning to which the tag that is the correct answer is attached.
  • the inference model for tag output is configured as a model such as a neural network that solves a classification problem that uses a vector representing a sentence as an input and a tag as an output.
  • the tagging processing unit 21 it is assumed that there is a break in the sentence at the place where there is a content break, and a tag is given to each divided sentence which is a set of separated sentences. Since the document contains sentences that are separated for each paragraph, the tagging by the tagging processing unit 21 can be widely applied to various documents.
  • the tag is added according to the rule, and if it does not apply to the tagging rule, the tag is added by a statistical method.
  • FIG. 6 is a block diagram showing a functional configuration example of the information processing device 1.
  • a content generation unit 22 is realized in addition to the tagging processing unit 21.
  • the tag information added by the tag assignment processing unit 21 is supplied to the content generation unit 22 together with the document to which the tag is attached.
  • the content generation unit 22 processes a document based on the tag assigned by the tag assignment processing unit 21 to generate content. For example, content such as a summary of a document targeted for tagging is generated by the content generation unit 22.
  • FIG. 7 is a diagram showing an example of generation of a summary document.
  • the summary document shown in FIG. 7 is a summary of a document composed of a plurality of slides.
  • the summary document is generated by extracting a predetermined slide from the entire slide and collecting the extracted slides. Slides are extracted using the tags assigned to each slide.
  • tags are attached to each of the slides on the first to eleventh pages.
  • the "Title”, “Table of Contents”, and “Summary” tags are attached to one slide, and the "Problem”, “Solution”, and “Result” tags are attached to a plurality of slides. In this way, the same type of tag may be attached to a plurality of divided sentences.
  • the summary document is generated, for example, by extracting one slide as a representative slide for each type of tag.
  • the slide on the 3rd page which is the slide near the beginning, is extracted as the representative slide and used in the abstract document.
  • the slide on the 6th page which is the slide with the highest importance, is extracted as the representative slide and used in the abstract document. ..
  • the importance of each slide is required.
  • As a method of calculating the importance it is possible to consider a sentence similar to many sentences in a document as an important sentence and adopt a method of calculating the importance of each sentence.
  • the slide on the 10th page which is the last slide, is extracted as a representative slide and used in the abstract document.
  • the user can read the document by thinning out the slides that are not important. This makes it possible to reduce the time it takes to read the document.
  • Discourse structure analysis is a natural language process that automatically estimates the logical relationship between the smallest elements (discourse units) that make up meaning and the intention of the writer in a sentence.
  • the content generation unit 22 analyzes the discourse structure of the tagged document and extracts the relationship between the slides.
  • the tag given by the tag giving processing unit 21 is used.
  • FIG. 8 is a diagram showing an example of extracting the relationship between slides.
  • the document shown in FIG. 8 is a document in which the tag described with reference to FIG. 7 is attached to each slide.
  • the content generation unit 22 uses tags as auxiliary information for discourse structure analysis, and as shown by arrow A11, the solution described in the slide on the fourth page becomes the problem described in the slide on the third page. Extract relationships such as the corresponding solution.
  • the slide on the third page is tagged with the “problem” and the slide on the fourth page is tagged with the “solution” tag.
  • the content generation unit 22 has a relationship that, as shown by arrow A12, the result described in the slide on the fifth page is an experimental result corresponding to the solution described in the slide on the fourth page. Is extracted.
  • the slide on page 4 is tagged with a "solution” and the slide on page 5 is tagged with a "result".
  • the content generation unit 22 extracts the relationship that the result described in the slide on the 8th page is the experimental result corresponding to the solution described in the slide on the 6th page. ..
  • the slide on page 6 is tagged with a "solution” and the slide on page 8 is tagged with a "result".
  • the content generation unit 22 extracts the relationship that the result described in the slide on the 9th page is the experimental result corresponding to the solution described in the slide on the 7th page. ..
  • the slide on page 7 is tagged with a "solution” and the slide on page 9 is tagged with a "result".
  • the problem described in the slide on the 10th page is the problem of the proposed method corresponding to the solution described in the slides on the 6th and 7th pages. Extract relationships such as existence.
  • the slides on the 6th and 7th pages are tagged with the "solution” tag, and the slides on the 10th page are tagged with the "problem".
  • the content generation unit 22 can improve the performance of extracting the relationship between slides by using the tag assigned by the tag assignment processing unit 21 as auxiliary information.
  • the relationship extracted by the content generation unit 22 is presented to the user together with the tag when reading the document.
  • a document to which information on the relationship between slides is added is generated as content by the content generation unit 22.
  • FIG. 9 is a diagram showing an example of generating a summary document.
  • the solution described on the third page is a solution corresponding to the problem described on the second page. Has been extracted. Further, as shown by arrow A22, it is extracted that the result described on the fourth page is the result corresponding to the solution described on the third page.
  • the document shown on the left side of FIG. 9 is a document in which the topic is divided between the fourth page and the subsequent pages.
  • the content generation unit 22 considers both the tag and the result of the discourse structure analysis, and extracts the representative page so as not to straddle the topic breaks as shown on the right side of FIG.
  • the "task” tag is added to the first page with the "title” tag and the ninth page with the "summary” tag so as not to straddle the topic breaks.
  • the second page, the third page with the "solution” tag, and the fourth page with the "result” tag are extracted.
  • FIG. 10 is a diagram showing a specific example of a sentence.
  • the text shown in FIG. 10 is the document on pages 2 to 7 shown in FIG.
  • the second page with the "problem” tag, the sixth page with the “solution” tag, and the seventh page with the “result” tag are the representative pages.
  • the problem on the second page is a problem that has nothing to do with the solution on the sixth page or the result on the seventh page, and becomes an inconsistent summary document.
  • the problem on the second page is "There is a problem that the execution time is long in deep learning.”
  • the solution on the sixth page is "To reduce the memory usage.
  • a technology
  • FIG. 11 is a diagram showing an example of a review.
  • the review shown in FIG. 11 is a review of a restaurant.
  • the sentence s2 of "The parfait I ordered immediately (500 yen) was very delicious. I want to go again.”
  • Is tagged as "important” and the sentences s1 and s3 are "relationship”.
  • the "None” tag is attached. Blank lines are inserted between each sentence.
  • the tagging processing unit 21 divides one review at the position of a blank line and assigns a tag to each divided sentence. In the review, it is assumed that a blank line is inserted at the position that separates the contents.
  • the content generation unit 22 performs the subsequent processing using only the sentence s2 to which the "important" tag is attached.
  • the content generation unit 22 it is determined based on the sentence s2 whether the review is positive content or negative content as the subsequent processing after tagging.
  • keywords are extracted from the sentence s2.
  • a review summary may be generated by grouping sentences tagged with "important".
  • the content generation unit 22 can remove unnecessary information from the review by performing the subsequent processing using the "important" and "irrelevant” tags.
  • FIG. 12 is a diagram showing an example of snippet generation.
  • tags "food”, “store atmosphere”, “clerk”, and “irrelevant” are prepared as tags representing the contents of the sentences that make up the review.
  • a snippet is generated by extracting only the sentence s2 to which the "food" tag is attached.
  • a snippet is generated by extracting only the sentence s3 to which the "atmosphere of the restaurant" tag is attached.
  • the content generation unit 22 selects which tag-attached sentence is extracted to generate the snippet, depending on the intended use.
  • FIG. 13 is a diagram showing an example of selection of a photograph (image) related to a snippet.
  • photo related to the snippet a photo related to the content of the snippet is selected and presented to the user together with the snippet.
  • the content generation unit 22 calculates the degree of relevance between the text s2 as a snippet and each of the photographs P1 to P3 as shown by the double-headed arrow, and selects the photo according to the relevance. .. In the example of FIG. 13, the most relevant photo P3 is selected as the photo to be presented with the snippet.
  • a list of snippets is displayed, and the full text of the review is often displayed according to the operation for displaying the details.
  • the snippet generated based on the tag on the list screen it is possible to present a snippet with a large amount of information as compared with the case where the first few lines of the review are displayed as the snippet.
  • a chart image that visually shows the content of the review may be generated based on the tag and presented to the user.
  • FIG. 14 is a diagram showing an example of review visualization.
  • the review R1 posted by the user # 1, the review R2 posted by the user # 2, and the review R3 posted by the user # 3 are shown.
  • the reviews R1 to R3 include sentences tagged with "food”, “store atmosphere”, and "clerk”, respectively.
  • the sentence s11 of "The clerk was kind” that composes the review R1 is a sentence with the "Clerk” tag attached, and "The parfait (500 yen) I ordered immediately was very delicious. I want to go again.
  • the sentence s12 of "I think.” Is a sentence to which the "food” tag is attached.
  • the sentence s13 of "The store was clean and calm” is a sentence with the "store atmosphere” tag.
  • sentences to which each tag is attached are analyzed by a method of emotion analysis or the like, and user satisfaction is estimated. For example, by analyzing the sentence s11, the satisfaction level of the user # 1 regarding the "clerk” is estimated, and by analyzing the sentence s12, the satisfaction level of the user # 1 regarding the "food” is estimated. By analyzing the sentence s13, the satisfaction level of the user # 1 regarding the "store atmosphere” is estimated.
  • the content generation unit 22 generates a chart image showing the estimation result of the satisfaction level regarding the content of each tag.
  • the chart image is configured by setting a value corresponding to the estimation result of the satisfaction level as the value of the axis corresponding to each tag.
  • chart images C1 to C3 are generated based on the reviews R1 to R3.
  • Chart images C1 to C3 that visualize and represent each review may be presented to the user, or as shown at the right end of FIG. 14, one chart image that summarizes the contents of a plurality of chart images is integrated. It may be presented to the user as an image showing the degree of satisfaction. The overall satisfaction is obtained by the average of the satisfaction of each user.
  • FIG. 15 is a diagram showing a configuration example of an information processing system.
  • the information processing system shown in FIG. 15 is configured by connecting the information processing device 1 and the information processing server 101 via a network 102.
  • the information processing server 101 is a server having a function of tagging processing.
  • Application software having the same function as the document tagging application 11 is installed in the information processing server 101.
  • Functions such as tagging processing may be realized by a plurality of servers including the information processing server 101.
  • the information processing server 101 receives the document transmitted from the information processing device 1 or the document managed on the predetermined server, and performs the tagging process as described above.
  • the information processing server 101 generates various contents such as summaries based on the document after the tagging process, and transmits the various contents to the information processing device 1.
  • the result of the tagging process and the content generated based on the result of the tagging process are presented to the user based on the information transmitted from the information processing server 101.
  • the tagging process may not be performed by the document tagging application 11 installed in the local device, but may be performed by the information processing server 101 on the network.
  • a mobile terminal such as a tablet terminal or a smartphone may be used as a local device on which the document tagging application 11 is installed.
  • FIG. 16 is a block diagram showing a configuration example of computer hardware that executes the above-mentioned series of processes programmatically.
  • the information processing device 1 and the information processing server 101 also have the same configuration as that shown in FIG.
  • the CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 205 is further connected to the bus 204.
  • An input unit 206 including a keyboard and a mouse, and an output unit 207 including a display and a speaker are connected to the input / output interface 205.
  • the input / output interface 205 is connected to a storage unit 208 composed of a hard disk, a non-volatile memory, or the like, a communication unit 209 composed of a network interface or the like, and a drive 210 for driving the removable media 211.
  • the CPU 201 loads the program stored in the storage unit 208 into the RAM 203 via the input / output interface 205 and the bus 204 and executes the program, thereby executing the series of processes described above. Is done.
  • the program executed by the CPU 201 is recorded on the removable media 211, or provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital broadcasting, and installed in the storage unit 208.
  • the program executed by the computer may be a program that is processed in chronological order according to the order described in this specification, or may be a program that is processed in parallel or at a necessary timing such as when a call is made. It may be a program in which processing is performed.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Therefore, a plurality of devices housed in separate housings and connected via a network, and a device in which a plurality of modules are housed in one housing are both systems. ..
  • this technology can have a cloud computing configuration in which one function is shared by a plurality of devices via a network and jointly processed.
  • each step described in the above flowchart can be executed by one device or shared by a plurality of devices.
  • one step includes a plurality of processes
  • the plurality of processes included in the one step can be executed by one device or shared by a plurality of devices.
  • a tag representing the content of the first part is attached to the first part of the part constituting the document that applies to the predetermined rule, and the second part that does not apply to the rule is attached.
  • an information processing apparatus including an information processing unit that assigns a tag representing the contents of the second part according to a statistical method.
  • the statistical method is a method using an inference model generated by machine learning.
  • the information processing apparatus according to (1) above further comprising a dividing portion for dividing the document into partial units to which the tag is to be attached.
  • the division unit divides the document into the partial units by dividing the text included in the document into divisions.
  • a tag representing the content of the first part is attached to the first part of the part constituting the document that applies to the predetermined rule according to the rule.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本技術は、文書の内容を柔軟に構造化することができるようにする情報処理装置、情報処理方法、およびプログラムに関する。 本技術の一側面の情報処理装置は、文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、第1の部分の内容を表すタグを規則に従って付与し、規則に当てはまらない第2の部分に対して、第2の部分の内容を表すタグを統計的手法に従って付与する情報処理部を備える。本技術は、文書の内容を構造化する情報処理装置に適用することができる。

Description

情報処理装置、情報処理方法、およびプログラム
 本技術は、特に、文書の内容を柔軟に構造化することができるようにした情報処理装置、情報処理方法、およびプログラムに関する。
 日常的に触れる多くの文書の内容を短時間で理解することは難しい。特に、先行研究や既存手法の調査のために参照されることが多い技術的資料のような文書は、専門的であるために、内容の理解に時間がかかってしまう。
 そこで、文書の内容の論理構造を解析する技術が各種提案されている。自動的に解析された論理構造を参考にすることにより、ユーザは、文書の理解のための時間を削減することができる。
 例えば特許文献1には、マークアップ言語のタグを手掛かりにして論理構造を特定したり、改行、コロン、ハイフンなどの区切り文字を手掛かりにして論理構造を特定したりする技術が開示されている。また、特許文献2には、設問と回答の形でデータ入力を受け付け、入力されたデータを構造化する技術が開示されている。
特開2019-105957号公報 特開2013-228807号公報
 特許文献1に記載の技術は、一定のルールに当てはまらない文書に対しては適用することができない。特許文献2に記載の技術は、入力されるデータが、設問と回答という形であらかじめ構造化されたデータであり、そのような構造化されたデータ以外の一般の文書に適用することができない。
 本技術はこのような状況に鑑みてなされたものであり、文書の内容を柔軟に構造化することができるようにするものである。
 本技術の一側面の情報処理装置は、文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する情報処理部を備える。
 本技術の一側面においては、文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、第1の部分の内容を表すタグが規則に従って付与され、規則に当てはまらない第2の部分に対して、第2の部分の内容を表すタグが統計的手法に従って付与される。
本技術の一実施形態に係るタグ付与機能を示す図である。 タグ付与の例を示す図である。 タグ付与処理について説明するフローチャートである。 タグ付与処理部の機能構成例を示すブロック図である。 タグ付与ルールの例を示す図である。 情報処理装置の機能構成例を示すブロック図である。 要約文書の生成の例を示す図である。 スライド間の関係の抽出の例を示す図である。 要約文書の生成の例を示す図である。 文章の具体例を示す図である。 レビューの例を示す図である。 スニペットの生成の例を示す図である。 スニペットに関連する写真の選択の例を示す図である。 レビューの視覚化の例を示す図である。 情報処理システムの構成例を示す図である。 コンピュータの構成例を示すブロック図である。
 以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
 1.タグ付与機能について
 2.タグの適用例
 3.変形例
<タグ付与機能について>
・文書タグ付与アプリケーション
 図1は、本技術の一実施形態に係るタグ付与機能を示す図である。
 図1に示すように、PCなどの情報処理装置1には文書タグ付与アプリケーション11がインストールされる。文書タグ付与アプリケーション11により、対象とする文書に対して、内容を表す属性情報としてのタグを付与するタグ付与機能が実現される。文書タグ付与アプリケーション11が処理の対象とする文書には複数の文章が含まれる。
 段落毎に区切られた文章を含む文書が対象の文書として入力された場合、図1の矢印の先に示すように、各段落に対して、各段落の内容を表すタグが付与される。段落の内容として、例えば、文書における各段落の論理構造(論理の流れにおける位置付け)を表すタグが付与される。文書タグ付与アプリケーション11からは、タグ付きの文書、または、各段落にどの種類のタグが付与されたのかなどのタグに関する情報が出力される。
 文書タグ付与アプリケーション11により付与されたタグは、例えば文書を読む際にユーザに提示される。ユーザは、タグを参照し、各段落にどのような内容が記載されているのかを確認しながら文書を読むことにより、文書の内容を素早く理解することが可能となる。
 このように、文書タグ付与アプリケーション11は、文章を含む文書の論理の流れを明確にし、文書を読む際の理解の助けとなるシステムを実現するものである。
 図2は、タグ付与の例を示す図である。
 図2の左側に示すように複数のスライド(ページ)からなる資料が対象の文書として入力された場合、それぞれのスライドに対して、各スライドの内容を表すタグが付与される。図2の例においては、1ページ目のスライドには「タイトル」のタグが付与され、2ページ目のスライドには「課題」のタグが付与されている。同様に、3ページ目乃至7ページ目のそれぞれのスライドに対して、「課題」、「課題」、「解決策」、「結果」、「まとめ」のタグが付与されている。
 このように、作成者によってスライド単位で内容がまとめられる資料を、タグを付与する対象の文書として用いることが可能である。このような資料には、例えば、Microsoft(商標)社が提供する「Power Point」の資料(pptファイル)などがある。文章を含む各種のデータに対してタグを付与することが可能である。
 例えば、対象となる文書の種類に応じて、付与するタグの種類が予め設定されている。文書のカテゴリ毎、作成者毎、作成日毎、読み手となるユーザ毎に異なる種類のタグが付与されるようにしてもよい。
 また、タグを付与する単位として、段落単位だけでなく、スライド単位など、様々な単位を採用することが可能である。
 さらに、同じ種類のタグが複数の単位に対して付与されるようにすることが可能である。図2の例においては、同じ「解決策」のタグが、3ページ目のスライドと4ページ目のスライドに対して付与されている。
 各スライドのタグが提示されることにより、ユーザは、各スライドに書かれている内容を参照しながら文書を読むことができる。書かれている内容を把握した上で各スライドを読み進めることにより、ユーザは、理解にかかる時間を削減することが可能となる。
・タグ付与処理の流れ
 文書タグ付与アプリケーション11によるタグ付与処理においては、予め決められた規則であるタグ付与ルールによるタグ付与と、統計的手法によるタグ付与とが行われる。
 図3のフローチャートを参照して、文書タグ付与アプリケーション11によるタグ付与処理について説明する。
 ステップS1において、文書タグ付与アプリケーション11は、対象となる文章を分割する。分割された部分毎にタグが付与される。
 ステップS2において、文書タグ付与アプリケーション11は、タグを付与するそれぞれの部分に注目し、タグ付与ルールに当てはまるか否かを判定する。タグ付与ルールに当てはまると判定した場合、処理はステップS3に進み、タグ付与ルールに当てはまらないと判定した場合、処理はステップS4に進む。
 ステップS3において、文書タグ付与アプリケーション11は、タグ付与ルールに当てはまる部分については、タグ付与ルールに従ってタグを付与する。
 一方、ステップS4において、文書タグ付与アプリケーション11は、タグ付与ルールに当てはまらない部分については、統計的手法によってタグを付与する。例えば、機械学習によって予め生成されたニューラルネットワークの推論モデルを用いてタグが付与される(推論される)。
 このように、論理構造のタグをルールによって付与できない場合には統計的手法を用いてタグを付与することにより、様々な形態の文書に柔軟に対応することが可能となる。
・機能構成
 図4は、タグ付与処理部21の機能構成例を示すブロック図である。図4に示す機能部のうちの少なくとも一部は、情報処理装置1のCPUにより文書タグ付与アプリケーション11が実行されることによって実現される。
 図4に示すように、情報処理部としてのタグ付与処理部21は、テキスト分割部31、ルールベースタグ付与部32、単語分割部33、ベクトル化処理部34、推論部35、およびモデル学習部36により構成される。対象となる文書は、テキスト分割部31に入力される。
 テキスト分割部31は、入力された文書を、タグ付与の単位となる部分毎に区切りに従って分割する。対象となる文書には、段落、改ページ、空行などの区切りが設定されている。図3のステップS1の処理が、テキスト分割部31により行われる処理となる。
 テキスト分割部31により分割された、段落単位、スライド単位などの文章から構成される分割済み文章は、ルールベースタグ付与部32に供給される。後段の処理は、それぞれの分割済み文章を対象として並列に行われる。各分割済み文章を対象とした処理が並列に、独立して行われるため、ある分割済み文章にどのタグが付与されるのかは、他の分割済み文章とは関係がない。
 ルールベースタグ付与部32は、分割済み文章がタグ付与ルールに当てはまるか否かを判定する。図3のステップS2の処理が、ルールベースタグ付与部32により行われる処理となる。
 図5は、タグ付与ルールの例を示す図である。
 図5の例においては、タグの種類として、「タイトル」、「課題」、「解決策」、「結果」、「その他」、「まとめ」のタグが示されている。「その他」のタグには、「自己紹介」、「目次」、「スケジュール」、「補足資料」、「その他」が含まれている。図5に示すタグ付与ルールは、複数のスライドから構成される資料を対象とした場合に用いられるルールである。
 「タイトル」タグは、スライドの1ページ目に付与されるタグである。
 「課題」タグは、「課題」の文字を含むタイトルのスライドに付与されるタグである。
 「解決策」タグは、「解決策」または「アプローチ」の文字を含むタイトルのスライドに付与されるタグである。
 「結果」タグは、「結果」の文字を含むタイトルのスライドに付与されるタグである。
 「その他」タグに含まれる「自己紹介」タグは、「自己紹介」、「経歴」、または「略歴」の文字を含むタイトルのスライドに付与されるタグである。
 「その他」タグに含まれる「目次」タグは、「目次」、「もくじ」、「アジェンダ」、または「agenda」の文字を含むタイトルのスライドに付与されるタグである。タイトルが「発表の流れ」、「内容」、「概要」、「contents」、「アウトライン」、または「outline」と一致するスライドに対しても「目次」タグが付与される。
 「その他」タグに含まれる「スケジュール」タグは、「スケジュール」、または「schedule」の文字を含むタイトルのスライドに付与されるタグである。
 「その他」タグに含まれる「補足資料」タグは、「まとめ」タグが付与されたページ以降のすべてのページに付与されるタグである。
 「まとめ」タグは、「まとめ」の文字を含むタイトルのスライドに付与されるタグである。
 このようなタグ付与ルールが、対象となる文書の種類毎に予め設定される。
 図4の説明に戻り、ルールベースタグ付与部32は、入力された分割済み文章がタグ付与ルールに当てはまる場合、タグ付与ルールに従ってタグを付与し、出力する。図4の例においては、矢印A1の先に示すように「課題」タグが付与されている。図3のステップS3の処理が、ルールベースタグ付与部32により行われる処理となる。
 また、ルールベースタグ付与部32は、入力された分割済み文章がタグ付与ルールに当てはまらない場合、その分割済み文章を単語分割部33に出力する。単語分割部33に出力された、タグ付与ルールに当てはまらない分割済み文章が、統計的手法を用いてタグを付与する部分となる。
 単語分割部33は、ルールベースタグ付与部32から供給された分割済み文章を構成する文章を単語に分割する。単語分割には様々なツールを使用することが可能である。単語分割部33により単語に分割された分割済み文章はベクトル化処理部34に供給される。
 ベクトル化処理部34は、単語分割部33から供給された分割済み文章をベクトル化する。分割済み文章のベクトル化には、例えば、単語の頻度を用いる方法、word2vecなどの方法が用いられる。分割済み文章の特徴を表すベクトルデータは、推論部35に供給される。なお、ベクトル化処理部34による分割済み文章のベクトル化は、推論部35において用いられる推論モデルの入力がベクトル化された文章である場合に行われる。
 推論部35は、ベクトル化処理部34から供給されたベクトルデータを推論モデルに入力し、分割済み文章に付与するタグを出力する。図4の例においては、矢印A2の先に示すように「解決策」タグが付与されている。図3のステップS4の処理が、推論部35により行われる処理となる。
 モデル学習部36は、学習用のデータとして用意された文章データを用いて機械学習を行い、推論部35により用いられる推論モデルを生成する。モデル学習部36による推論モデルの学習は、例えば、正解となるタグが付与された学習用の文章データを用いて行われる。タグ出力用の推論モデルは、文章を表すベクトルを入力とし、タグを出力とする分類問題を解くニューラルネットワークなどのモデルとして構成される。
 このように、タグ付与処理部21においては、内容的な区切りのある箇所では文章にも区切りが存在すると仮定し、区切られたひとまとまりの文章である分割済み文章毎にタグが付与される。段落毎に分かれている文章を含む文書であればよいため、タグ付与処理部21によるタグ付与は、各種の文書に広く適用することが可能となる。
 また、特にタグ付与については、分割済み文章がタグ付与ルールに当てはまる場合にはルールに従ってタグが付与され、タグ付与ルールに当てはまらない場合には統計的手法によりタグが付与される。
 このように、ルールによるタグ付与の手法と統計的手法とを組み合わせることにより、ルールだけでは論理構造をとらえきれない文書に対しても、適切にタグを付与することが可能となる。
<タグの適用例>
 タグ付与処理部21により付与されたタグを用いた処理について説明する。
 図6は、情報処理装置1の機能構成例を示すブロック図である。
 図6に示すように、情報処理装置1においては、タグ付与処理部21の他にコンテンツ生成部22が実現される。タグ付与処理部21により付与されたタグの情報は、タグ付与の対象とされた文書とともにコンテンツ生成部22に供給される。
 コンテンツ生成部22は、タグ付与処理部21により付与されたタグに基づいて文書を加工し、コンテンツを生成する。例えば、タグ付与の対象とされた文書の要約などのコンテンツがコンテンツ生成部22により生成される。
・タグを用いた要約の生成
 図7は、要約文書の生成の例を示す図である。
 図7に示す要約文書は、複数のスライドから構成される文書の要約である。要約文書の生成は、スライド全体の中から所定のスライドを抽出し、抽出したスライドをまとめることによって行われる。スライド毎に付与されたタグを用いて、スライドの抽出が行われる。
 図7の例においては、1ページ目乃至11ページ目のスライドのそれぞれに対してタグが付与されている。「タイトル」、「目次」、「まとめ」タグについては1枚のスライドに付与され、「課題」、「解決策」、「結果」タグについては複数のスライドに付与されている。このように、同じ種類のタグが複数の分割済み文章に対して付与されることもある。
 要約文書の生成は、例えば、タグの種類毎に、代表スライドとなる1枚のスライドを抽出するようにして行われる。
 図7の右側に示すように、「タイトル」タグが付与された1ページ目、「目次」タグが付与された2ページ目、「まとめ」タグが付与された11ページ目のスライドについては、それらのタグが付与されたスライドが1枚だけであるから、そのまま、要約文書に用いられる。
 「課題」タグが付与された3ページ目と8ページ目のスライドについては、先頭に近いスライドである3ページ目のスライドが代表スライドとして抽出され、要約文書に用いられる。
 「解決策」タグが付与された4ページ目、6ページ目、7ページ目のスライドのうち、重要度が最大のスライドである6ページ目のスライドが代表スライドとして抽出され、要約文書に用いられる。このように、同じタグが複数のスライドに付与されている場合、スライド毎の重要度が求められる。重要度の計算手法として、文書中の多くの文章と類似する文章を重要な文章と見なして、それぞれの文章の重要度を計算する手法を採用することが可能である。
 「結果」タグが付与された5ページ目、9ページ目、10ページ目のスライドのうち、最後のスライドである10ページ目のスライドが代表スライドとして抽出され、要約文書に用いられる。
 このように、代表ページの選び方は、タグの種類毎に設定される。
 コンテンツ生成部22による要約文書の生成が以上のようにして行われることにより、ユーザは、重要ではないスライドを間引いて文書を読むことができる。これにより文書を読むのにかかる時間を削減することが可能となる。
・タグを用いた談話構造解析
 談話構造解析は、文章において、意味を構成する最小要素(談話単位)どうしの論理的な関係や書き手の意図を自動的に推定する自然言語処理である。コンテンツ生成部22は、タグ付与が行われた文書を対象として談話構造解析を行い、スライド間の関係を抽出する。スライド間の関係を抽出するための補助情報として、タグ付与処理部21により付与されたタグが用いられる。
 図8は、スライド間の関係の抽出の例を示す図である。
 図8に示す文書は、図7を参照して説明したタグが各スライドに付与された文書である。コンテンツ生成部22は、談話構造解析の補助情報としてタグを用い、矢印A11に示すように、4ページ目のスライドに記載されている解決策が、3ページ目のスライドに記載されている課題に対応する解決策であるといった関係を抽出する。図8に示すように、3ページ目のスライドには「課題」タグが付与され、4ページ目のスライドには「解決策」タグが付与されている。
 同様に、コンテンツ生成部22は、矢印A12に示すように、5ページ目のスライドに記載されている結果が、4ページ目のスライドに記載されている解決策に対応する実験結果であるといった関係を抽出する。4ページ目のスライドには「解決策」タグが付与され、5ページ目のスライドには「結果」タグが付与されている。
 コンテンツ生成部22は、矢印A13に示すように、8ページ目のスライドに記載されている結果が、6ページ目のスライドに記載されている解決策に対応する実験結果であるといった関係を抽出する。6ページ目のスライドには「解決策」タグが付与され、8ページ目のスライドには「結果」タグが付与されている。
 コンテンツ生成部22は、矢印A14に示すように、9ページ目のスライドに記載されている結果が、7ページ目のスライドに記載されている解決策に対応する実験結果であるといった関係を抽出する。7ページ目のスライドには「解決策」タグが付与され、9ページ目のスライドには「結果」タグが付与されている。
 コンテンツ生成部22は、矢印A15に示すように、10ページ目のスライドに記載されている課題が、6ページ目および7ページ目のスライドに記載されている解決策に対応する提案法の課題であるといった関係を抽出する。6ページ目および7ページ目のスライドには「解決策」タグが付与され、10ページ目のスライドには「課題」タグが付与されている。
 このように、コンテンツ生成部22は、タグ付与処理部21により付与されたタグを補助情報として用いることにより、スライド間の関係性の抽出の性能を向上させることできる。
 コンテンツ生成部22により抽出された関係性は、文書を読むときにタグとともにユーザに提示される。スライド間の関係性に関する情報が付加された文書が、コンテンツ生成部22によりコンテンツとして生成される。スライド間の関係性をタグとともに参照することにより、ユーザは、内容をより深く理解することが可能となる。
・談話構造解析の結果を用いた要約の生成
 要約文書を構成する代表ページの抽出が、タグと談話構造解析の結果とを用いて行われるようにすることも可能である。
 談話構造解析の結果を考慮することにより、論理的な整合性が保たれた要約文書を生成することが可能になる。要約文書の生成に考慮される談話構造解析の結果は、図8に示すようにして抽出されたスライド間の関係性である。
 図9は、要約文書の生成の例を示す図である。
 図9の例においては、タグ付与処理が行われることにより、1ページ目乃至9ページ目のそれぞれのスライドに対して、「タイトル」、「課題」、「解決策」、「結果」、「課題」、「解決策」、「結果」、「課題」、「まとめ」のそれぞれのタグが付与されている。
 コンテンツ生成部22により談話構造解析が行われることにより、矢印A21に示すように、3ページ目に記載されている解決策が、2ページ目に記載されている課題に対応する解決策であることが抽出されている。また、矢印A22に示すように、4ページ目に記載されている結果が、3ページ目に記載されている解決策に対応する結果であることが抽出されている。
 同様に、矢印A23に示すように、6ページ目に記載されている解決策が、5ページ目に記載されている課題に対応する解決策であることが抽出されている。矢印A24に示すように、7ページ目に記載されている結果が、6ページ目に記載されている解決策に対応する結果であることが抽出されている。矢印A25に示すように、8ページ目に記載されている課題が、6ページ目に記載されている解決策に対応する課題であることが抽出されている。
 図9の左側に示す文書は、4ページ目までと、それ以降とで話題に区切りがある文書である。
 このような場合において、タグのみを考慮して代表ページの抽出が行われた場合、図9の中央に示すように、「タイトル」タグが付与された1ページ目と「まとめ」タグが付与された9ページ目とともに、話題の区切りを跨いで、「課題」タグが付与された2ページ目、「解決策」タグが付与された6ページ目、「結果」タグが付与された7ページ目が抽出されることがある。話題の区切りを跨いでいるから、要約文書は、論理的な整合性が保たれてない可能性がある。
 コンテンツ生成部22は、タグと談話構造解析の結果の両方を考慮し、図9の右側に示すように、話題の区切りを跨がないように代表ページの抽出を行う。
 図9の右側の例においては、「タイトル」タグが付与された1ページ目と「まとめ」タグが付与された9ページ目とともに、話題の区切りを跨がないように、「課題」タグが付与された2ページ目、「解決策」タグが付与された3ページ目、「結果」タグが付与された4ページ目が抽出されている。
 これにより、コンテンツ生成部22は、論理的な整合性が保たれた要約文書を生成することが可能になる。
 このようにして論理的な整合性が保たれた要約文書を読むことにより、論理的な整合性が保たれていない要約文書を読む場合と比べて、ユーザは、内容を誤解してしまうことを防ぐことが可能となる。
 図10は、文章の具体例を示す図である。
 図10に示す文章は、図9に示す2ページ目乃至7ページ目の文書である。
 このような文章のタグのみを考慮し、「課題」タグが付与された2ページ目、「解決策」タグが付与された6ページ目、「結果」タグが付与された7ページ目が代表ページとして抽出された場合、2ページ目の課題は、6ページ目の解決策や7ページ目の結果とは関係のない課題であり、整合性が保たれていない要約文書となる。図10の例においては、2ページ目の課題は「ディープラーニングにおいて、実行時間が長いという問題がある。」というものであり、例えば6ページ目の解決策は「メモリ使用量削減のために〇〇という技術を開発した。」というものである。
 タグと談話構造解析の結果の両方を考慮し、話題の区切りを跨がないように代表ページを抽出することにより、このような整合性が保たれていない要約文書が生成されてしまうことを防ぐことが可能となる。
 タグと談話構造解析の結果の両方を考慮して抽出された2ページ目の課題は、3ページ目の「実行時間削減のための〇〇という技術を開発した。」という解決策に対応するものであり、4ページ目の「実験の結果、〇〇%の実行時間削減ができた。」という結果は、3ページ目の解決策に対応するものである。2ページ目、3ページ目、および4ページ目を含む要約文書は、内容に一貫性があり、整合的が保たれたものとなる。
・レビューの重要箇所抽出
 レビューサイトに書き込まれたレビューを対象としてタグ付与処理が行われるようにすることも可能である。この場合、1つのレビューを1つの文書として、レビューを構成するそれぞれの部分に対してタグが付与される。この例においては、レビューを対象としたタグ付与処理によって「重要」と「関係なし」のタグが付与される。
 図11は、レビューの例を示す図である。
 図11に示すレビューは、ある飲食店のレビューである。図11の例においては、「早速注文したパフェ(500円)は非常においしかった。また行きたいと思う。」の文章s2には「重要」タグが付与され、文章s1,s3には「関係なし」タグが付与されている。各文章の間には空行が挿入されている。
 タグ付与処理部21においては、1つのレビューを空行の位置で分割し、それぞれの分割済み文章に対してタグを付与する処理が行われる。レビューにおいては、内容の区切りとなる位置に空行が挿入されていると仮定される。
 このようなタグが付与されている場合、コンテンツ生成部22は、「重要」タグが付与された文章s2のみを用いて後段の処理を行う。
 例えば、コンテンツ生成部22においては、タグ付与後の後段の処理として、ポジティブな内容のレビューであるか、ネガティブな内容のレビューであるかが文章s2に基づいて判定される。また、文章s2からキーワードが抽出される。
 タグ付与後の後段の処理として、ポジティブ/ネガティブ判定、キーワード抽出以外の処理が行われるようにすることも可能である。例えば、「重要」タグが付与された文章をまとめることによってレビューの要約が生成されるようにしてもよい。
 「重要」と「関係なし」のタグを用いて後段の処理を行うことにより、コンテンツ生成部22は、不要な情報をレビューから取り除くことができる。
 レビューを対象として検索を行う場合に、「重要」タグが付与された文章のみを用いることによって、ユーザが期待する情報の検索精度を向上させることが可能となる。
・レビューのスニペット(要約)の生成
 図12は、スニペットの生成の例を示す図である。
 図12の例においては、図11を参照して説明した文章と同じ文章s1と文章s2に加えて、「店はきれいめで落ち着いた感じだった」の文章s3からなるレビューが、スニペットの生成の対象とされている。図12の例においては、文章s1には「関係なし」タグが付与され、文章s2には「食べ物」タグが付与されている。また、文章s3には「店の雰囲気」タグが付与されている。
 例えば、レビューを構成する文章の内容を表すタグとして「食べ物」、「店の雰囲気」、「店員」、「関係なし」のタグが用意される。
 コンテンツ生成部22においては、例えば飲食店のメニューに関する情報をユーザに提示する場合、「食べ物」タグが付与された文章s2のみを抽出することによってスニペットが生成される。同様に、飲食店の雰囲気に関する情報をユーザに提示する場合、「店の雰囲気」タグが付与された文章s3のみを抽出することによってスニペットが生成される。どのタグが付与された文章を抽出してスニペットを生成するのかは、用途に応じて、コンテンツ生成部22により選択される。
 図13は、スニペットに関連する写真(画像)の選択の例を示す図である。
 複数の写真がレビューに添付されていることがある。スニペットに関連する写真として、スニペットの内容と関連のある写真が選択され、スニペットとともにユーザに提示される。
 図13の例においては、写真P1乃至P3の3枚の写真がレビューに添付されている。この場合、コンテンツ生成部22は、双方向の矢印で示すように、スニペットとしての文章s2と、写真P1乃至P3のそれぞれの写真との関連度を計算し、関連度に応じて写真を選択する。図13の例においては、関連度が最も高い写真P3が、スニペットとともに提示する写真として選択されている。
 レビューの一覧画面においては、スニペットの一覧が表示され、詳細を表示させるための操作が行われることに応じて、レビューの全文が表示されるようになっていることが多い。タグに基づいて生成したスニペットを一覧画面に表示することにより、レビューの最初の数行の文章をスニペットとして表示する場合に比べて、情報量の多いスニペットを提示することが可能となる。
・レビューの視覚化
 レビューの内容を視覚的に示すチャート画像がタグに基づいて生成され、ユーザに提示されるようにしてもよい。
 図14は、レビューの視覚化の例を示す図である。
 図14の例においては、ユーザ#1により投稿されたレビューR1、ユーザ#2により投稿されたレビューR2、および、ユーザ#3により投稿されたレビューR3が示されている。レビューR1乃至R3には、それぞれ、「食べ物」、「店の雰囲気」、「店員」のタグが付与された文章が含まれる。
 例えば、レビューR1を構成する「店員さんは優しかった。」の文章s11は「店員」タグが付与された文章であり、「早速注文したパフェ(500円)は非常においしかった。また行きたいと思う。」の文章s12は「食べ物」タグが付与された文章である。「店はきれいめで落ち着いた感じだった。」の文章s13は「店の雰囲気」タグが付与された文章である。
 コンテンツ生成部22においては、感情分析の手法などによって、各タグが付与された文章が解析され、ユーザの満足度が推定される。例えば、文章s11を解析することによってユーザ#1の「店員」に関する満足度が推定され、文章s12を解析することによってユーザ#1の「食べ物」に関する満足度が推定される。文章s13を解析することによってユーザ#1の「店の雰囲気」に関する満足度が推定される。
 また、コンテンツ生成部22においては、各タグの内容に関する満足度の推定結果を表すチャート画像が生成される。チャート画像は、各タグに対応する軸の値として、満足度の推定結果に応じた値が設定されることによって構成される。図13の例においては、レビューR1乃至R3に基づいて、チャート画像C1乃至C3が生成されている。
 各レビューを視覚化して表すチャート画像C1乃至C3がユーザに提示されるようにしてもよいし、図14の右端に示すように、複数のチャート画像の内容をまとめた1つのチャート画像が、総合的な満足度を表す画像としてユーザに提示されるようにしてもよい。総合的な満足度は各ユーザの満足度の平均などにより求められる。
 通常のレビューサイトにおいては、満足度を表す星などがユーザ(レビュワー)により手入力される。ユーザが意図していない星が誤入力されることもある。ユーザが投稿した文章に基づいて満足度を推定し、視覚化することにより、誤入力がそのまま表示されるのを防ぐことが可能となる。
 また、タグに応じた軸を有するチャート画像を表示することにより、星の数などの一次元的な指標を用いる場合よりも、総合的な評判を可視化することができる。
 レビューの対象となった店にとっても、どの点の評判がよく、どの点が改善すべき点なのかを一目で確認することが可能となる。
<変形例>
・システム構成の例
 文書タグ付与アプリケーション11によるタグ付与処理が情報処理装置1により行われるものとしたが、以上のようなタグ付与処理と、タグ付与処理後のコンテンツ生成が、サーバ-クライアントシステムにおいて実現されるようにしてもよい。
 図15は、情報処理システムの構成例を示す図である。
 図15に示す情報処理システムは、情報処理装置1と情報処理サーバ101とがネットワーク102を介して接続されることによって構成される。
 情報処理サーバ101は、タグ付与処理の機能を有するサーバである。情報処理サーバ101には、文書タグ付与アプリケーション11と同様の機能を有するアプリケーションソフトウェアがインストールされている。タグ付与処理等の機能が、情報処理サーバ101を含む複数のサーバにより実現されるようにしてもよい。
 情報処理サーバ101は、情報処理装置1から送信されてきた文書、または、所定のサーバ上で管理される文書を受信し、上述したようなタグ付与処理を行う。情報処理サーバ101は、タグ付与処理後の文書に基づいて、要約などの各種のコンテンツを生成し、情報処理装置1に対して送信する。
 情報処理装置1においては、情報処理サーバ101から送信されてきた情報に基づいて、タグ付与処理の結果や、タグ付与処理の結果に基づいて生成されたコンテンツがユーザに提示される。
 このように、ローカルの装置にインストールされた文書タグ付与アプリケーション11によりタグ付与処理が行われるのではなく、ネットワーク上の情報処理サーバ101により行われるようにしてもよい。
 文書タグ付与アプリケーション11がインストールされるローカルの装置として、タブレット端末、スマートフォンなどの携帯端末が用いられるようにしてもよい。
・コンピュータの構成例
 上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
 図16は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
 情報処理装置1、および情報処理サーバ101も、図16に示す構成と同じ構成を有する。
 CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203は、バス204により相互に接続されている。
 バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、キーボード、マウスなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207が接続される。また、入出力インタフェース205には、ハードディスクや不揮発性のメモリなどよりなる記憶部208、ネットワークインタフェースなどよりなる通信部209、リムーバブルメディア211を駆動するドライブ210が接続される。
 以上のように構成されるコンピュータでは、CPU201が、例えば、記憶部208に記憶されているプログラムを入出力インタフェース205及びバス204を介してRAM203にロードして実行することにより、上述した一連の処理が行われる。
 CPU201が実行するプログラムは、例えばリムーバブルメディア211に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部208にインストールされる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
 本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
・構成の組み合わせ例
 本技術は、以下のような構成をとることもできる。
(1)
 文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する情報処理部を備える
 情報処理装置。
(2)
 前記統計的手法は、機械学習によって生成された推論モデルを用いた手法である
 前記(1)に記載の情報処理装置。
(3)
 前記文書を、前記タグを付与する対象となる部分単位に分割する分割部をさらに備える
 前記(1)に記載の情報処理装置。
(4)
 前記分割部は、前記文書に含まれる文章を区切り毎に分割することによって、前記文書を前記部分単位に分割する
 前記(1)乃至(3)のいずれかに記載の情報処理装置。
(5)
 前記文書の要約を前記タグに基づいて生成する生成部をさらに備える
 前記(1)乃至(4)のいずれかに記載の情報処理装置。
(6)
 前記生成部は、前記文書を構成するページを前記タグに基づいてページ単位で抽出し、抽出した前記ページから構成される前記要約を生成する
 前記(5)に記載の情報処理装置。
(7)
 前記生成部は、前記タグの種類毎に1ページを抽出する
 前記(5)または(6)に記載の情報処理装置。
(8)
 前記生成部は、複数の前記ページ間の内容の関係の解析を前記タグに基づいて行う
 前記(6)または(7)に記載の情報処理装置。
(9)
 前記生成部は、前記文書に含まれる文章のうちの重要部分を、前記タグに基づいて段落単位で抽出し、抽出した前記重要部分を前記要約として生成する
 前記(5)に記載の情報処理装置。
(10)
 前記生成部は、前記重要部分と前記文書に添付されたそれぞれの写真との関連度を算出し、前記重要部分と、前記関連度に基づいて選択した前記写真とから構成される前記要約を生成する
 前記(9)に記載の情報処理装置。
(11)
 前記文章の内容に応じた点数を前記タグの種類毎に可視化して表すチャート画像を生成する生成部をさらに備える
 前記(1)に記載の情報処理装置。
(12)
 情報処理装置が、
 文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、
 前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する
 情報処理方法。
(13)
 コンピュータに、
 文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、
 前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する
 処理を実行させるためのプログラム。
 1 情報処理装置, 11 文書タグ付与アプリケーション, 21 タグ付与処理部, 22 コンテンツ生成部, 31 テキスト分割部, 32 ルールベースタグ付与部, 33 単語分割部, 34 ベクトル化処理部, 35 推論部, 36 モデル学習部, 101 情報処理サーバ

Claims (13)

  1.  文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する情報処理部を備える
     情報処理装置。
  2.  前記統計的手法は、機械学習によって生成された推論モデルを用いた手法である
     請求項1に記載の情報処理装置。
  3.  前記文書を、前記タグを付与する対象となる部分単位に分割する分割部をさらに備える
     請求項1に記載の情報処理装置。
  4.  前記分割部は、前記文書に含まれる文章を区切り毎に分割することによって、前記文書を前記部分単位に分割する
     請求項3に記載の情報処理装置。
  5.  前記文書の要約を前記タグに基づいて生成する生成部をさらに備える
     請求項1に記載の情報処理装置。
  6.  前記生成部は、前記文書を構成するページを前記タグに基づいてページ単位で抽出し、抽出した前記ページから構成される前記要約を生成する
     請求項5に記載の情報処理装置。
  7.  前記生成部は、前記タグの種類毎に1ページを抽出する
     請求項6に記載の情報処理装置。
  8.  前記生成部は、複数の前記ページ間の内容の関係の解析を前記タグに基づいて行う
     請求項6に記載の情報処理装置。
  9.  前記生成部は、前記文書に含まれる文章のうちの重要部分を、前記タグに基づいて段落単位で抽出し、抽出した前記重要部分を前記要約として生成する
     請求項5に記載の情報処理装置。
  10.  前記生成部は、前記重要部分と前記文書に添付されたそれぞれの写真との関連度を算出し、前記重要部分と、前記関連度に基づいて選択した前記写真とから構成される前記要約を生成する
     請求項9に記載の情報処理装置。
  11.  前記文章の内容に応じた点数を前記タグの種類毎に可視化して表すチャート画像を生成する生成部をさらに備える
     請求項4に記載の情報処理装置。
  12.  情報処理装置が、
     文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、
     前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する
     情報処理方法。
  13.  コンピュータに、
     文書を構成する部分のうちの、予め決められた規則に当てはまる第1の部分に対して、前記第1の部分の内容を表すタグを前記規則に従って付与し、
     前記規則に当てはまらない第2の部分に対して、前記第2の部分の内容を表すタグを統計的手法に従って付与する
     処理を実行させるためのプログラム。
PCT/JP2020/043736 2019-12-09 2020-11-25 情報処理装置、情報処理方法、およびプログラム WO2021117483A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-222246 2019-12-09
JP2019222246 2019-12-09

Publications (1)

Publication Number Publication Date
WO2021117483A1 true WO2021117483A1 (ja) 2021-06-17

Family

ID=76329827

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/043736 WO2021117483A1 (ja) 2019-12-09 2020-11-25 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
WO (1) WO2021117483A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024028958A1 (ja) * 2022-08-01 2024-02-08 日本電信電話株式会社 サービス提供装置、サービス提供方法、及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652162A (ja) * 1991-09-20 1994-02-25 Fujitsu Ltd 文書構造データベース構築処理方式
JP2009169536A (ja) * 2008-01-11 2009-07-30 Ricoh Co Ltd 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
JP2012003574A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性辞書編集支援システム及びプログラム
JP2019105957A (ja) * 2017-12-12 2019-06-27 コニカミノルタ株式会社 文書構成解析システム、文書構成解析方法、プログラム
WO2019173860A1 (en) * 2018-03-14 2019-09-19 D2D Crc Ltd. Method and system for data curation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652162A (ja) * 1991-09-20 1994-02-25 Fujitsu Ltd 文書構造データベース構築処理方式
JP2009169536A (ja) * 2008-01-11 2009-07-30 Ricoh Co Ltd 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
JP2012003574A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性辞書編集支援システム及びプログラム
JP2019105957A (ja) * 2017-12-12 2019-06-27 コニカミノルタ株式会社 文書構成解析システム、文書構成解析方法、プログラム
WO2019173860A1 (en) * 2018-03-14 2019-09-19 D2D Crc Ltd. Method and system for data curation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024028958A1 (ja) * 2022-08-01 2024-02-08 日本電信電話株式会社 サービス提供装置、サービス提供方法、及びプログラム

Similar Documents

Publication Publication Date Title
US10380197B2 (en) Network searching method and network searching system
EP3575984A1 (en) Artificial intelligence based-document processing
Hullman et al. Contextifier: automatic generation of annotated stock visualizations
Bakiu et al. Which feature is unusable? Detecting usability and user experience issues from user reviews
US9582591B2 (en) Generating visual summaries of research documents
Wanner et al. State-of-the-Art Report of Visual Analysis for Event Detection in Text Data Streams.
US20190243848A1 (en) Generating a structured document guiding view
US20110288897A1 (en) Method of agent assisted response to social media interactions
US20130263019A1 (en) Analyzing social media
RU2696305C2 (ru) Браузинг изображений через интеллектуально проанализированные связанные гиперссылкой фрагменты текста
US11232134B2 (en) Customized visualization based intelligence augmentation
US20150120735A1 (en) Text mining system, text mining method, and program
US20140379719A1 (en) System and method for tagging and searching documents
US20200142954A1 (en) Document Production by Conversion from Wireframe to Darwin Information Typing Architecture (DITA)
CN106462933B (zh) 使用内容结构来社交地连接用户
CN108733635B (zh) 一种文本信息展示方法及装置
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
CN114861677B (zh) 信息抽取方法、装置、电子设备以及存储介质
US20120046937A1 (en) Semantic classification of variable data campaign information
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
WO2021117483A1 (ja) 情報処理装置、情報処理方法、およびプログラム
Lund Assessing library topics using sentiment analysis in R: a discussion and code sample
US20140236939A1 (en) Systems and methods for topical grouping of search results and organizing of search results
KR20160091756A (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
CN109992711A (zh) 信息推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20900467

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20900467

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP