WO2020012595A1 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents

情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDF

Info

Publication number
WO2020012595A1
WO2020012595A1 PCT/JP2018/026306 JP2018026306W WO2020012595A1 WO 2020012595 A1 WO2020012595 A1 WO 2020012595A1 JP 2018026306 W JP2018026306 W JP 2018026306W WO 2020012595 A1 WO2020012595 A1 WO 2020012595A1
Authority
WO
WIPO (PCT)
Prior art keywords
article
keyword
information
user
cluster
Prior art date
Application number
PCT/JP2018/026306
Other languages
English (en)
French (fr)
Inventor
愼吾 原澤
Original Assignee
楽天株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 楽天株式会社 filed Critical 楽天株式会社
Priority to PCT/JP2018/026306 priority Critical patent/WO2020012595A1/ja
Priority to JP2019506537A priority patent/JP6533354B1/ja
Publication of WO2020012595A1 publication Critical patent/WO2020012595A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Definitions

  • the present invention relates to an information processing apparatus, an information processing method, a program, and a storage medium, and more particularly, to a technique for supporting generation of an article headline of an article published on a news publication site.
  • Websites where news articles can be viewed are provided with specific article publication locations for providing articles that the viewer prefers to view from among a large number of article groups .
  • the specific article publication location is provided, for example, on the top page of a news publication site.
  • an article headline for briefly explaining the article content may be published. This is because it is not possible to secure a space for carrying the full text of the article or to provide many articles (users) to the user.
  • Patent Document 1 shown below discloses a configuration for generating a summary of the contents of a web page.
  • Patent Literature 1 If the configuration shown in Patent Literature 1 is used, it may be possible to generate an article headline that simply shows the content of a news article. However, the article headings generated in this way have the same wording regardless of the user (viewer), and are not always the most suitable texts for the user.
  • the present invention has been made in view of such circumstances, and has as its object to provide an environment for generating an article headline sentence suitable for each user.
  • An information processing apparatus includes an article management unit that receives a distribution article and manages it as a new article, a classification processing unit that classifies the new article into an article cluster, and an article of a popular article belonging to the article cluster and having a high number of views.
  • a noticeable keyword management unit that manages a noticeable keyword of an article cluster to which the popular article belongs based on a keyword acquired from the headline sentence; a user information management unit that manages user information including constraint information about a user;
  • a keyword determining unit that determines an appropriate personal keyword for each user based on the article cluster, the article content of the newly arrived article, the constraint information, and the keyword of interest, and generates an article headline sentence of the newly arrived article using the personal keyword.
  • a presentation information generation unit for generating presentation information for the purpose. Creating a headline manually according to the content of the article requires a very large number of steps. According to this configuration, the keyword of interest is managed for each article cluster, and presentation information according to the article content is generated using the keyword of interest. Examples of the presentation information include a keyword candidate that can be used for an article headline and a candidate for an article headline.
  • the keyword determination unit of the information processing device described above performs a first selection process of selecting a first keyword corresponding to the article cluster from the target keyword, and a second selection process based on the article content of the newly-arrived article from the first keyword.
  • a second selection process of selecting a keyword and a third selection process of selecting the individual keyword from the second keyword according to the constraint information may be performed. That is, a keyword of interest of an appropriate article cluster corresponding to a newly arrived article is selected as a first keyword, and an appropriate keyword corresponding to the article content of a newly arrived article is selected as a second keyword from among the first keywords.
  • An appropriate keyword is selected and determined as a personal keyword according to the constraint information for each user who views the article. Therefore, the determined personal keyword is appropriate for the article cluster of the newly arrived article, is in accordance with the article content, and further takes into account the constraint information of the user.
  • the keyword determination unit of the information processing device described above determines the personal keyword for some articles in the newly arrived articles, and the presentation information generation unit generates presentation information about the some articles. There may be. That is, the presentation information is not generated for all the newly arrived articles, but is generated for some of the newly arrived articles.
  • the information processing apparatus described above may include a presentation unit that presents the presentation information in a state where an operation for generating an article heading is possible. For example, some article headline candidates are posted, and a web page provided with an interface from which one can be selected from the candidates is presented to the operator. In addition, an interface is provided for editing one selected article heading sentence candidate, and the operator can create an article heading by a simple operation.
  • the presentation information generation unit of the information processing device described above may generate an article heading composed of a predetermined number of characters as the presentation information.
  • the operator who determines the article heading need only select one of the automatically generated article heading candidates.
  • the information processing apparatus described above includes a similarity determination unit that determines similarity between an article headline sentence posted within the latest predetermined period and an article headline sentence generated by the presentation information generation unit, and the presentation information generation unit includes: Alternatively, when the similarity determination unit determines similarity, the article heading sentence as the presentation information may be regenerated. By providing the similarity determination unit, similarity / dissimilarity between article headlines can be determined.
  • the constraint information may be information on a user's language ability. For example, if the same article headline is used for a person with high ability and a person with low ability in Japanese, the article contents estimated by the user who saw the article headline may be different, or the article contents may be estimated in the first place. May not be possible. According to this configuration, in order to cope with such a situation, the attention keyword according to the level of the language ability is determined as the individual keyword.
  • the restriction information may be information relating to a visual impairment of a user.
  • a blind person who is completely blind obtains the information of the article headline and the article text by voice.
  • An unsuitable attention keyword in such a situation is, for example, a homonym.
  • the presentation information is generated using the attention keyword other than the unsuitable word such as the homonym.
  • the information processing device is configured based on a request receiving unit that receives a web page request from the terminal device, an article cluster to which the article belongs, the article content of the article, and constraint information of a user who uses the terminal device.
  • a web page generation unit that obtains the generated article headline sentence for each user and generates information of a web page on which the article headline sentence for each user is posted, and transmits the generated web page information to the terminal device.
  • a transmitting unit that performs the processing.
  • the information processing apparatus described above includes a replacement processing unit that performs a replacement process for the keyword of interest based on the constraint information, and the keyword determination unit determines a keyword obtained by the replacement process as the personal keyword. May be. If the keyword of interest is not appropriate for some users, another keyword of interest may be determined as a personal keyword for that user. However, according to this configuration, other keywords may be used for the user. Presentation information for generating a simple article headline sentence is generated.
  • An information processing method includes an article management step of receiving a distribution article and managing it as a new article, a classification processing step of classifying the new article into an article cluster, and an article of a popular article belonging to the article cluster and having a high number of views.
  • the information processing method includes a request receiving step of receiving a web page request from a terminal device, an article cluster to which an article belongs, an article content of the article, and constraint information of a user who uses the terminal device.
  • a transmitting step of transmitting to the terminal device With this information processing method, it is possible to provide an environment for generating an article headline sentence suitable for each user.
  • a program according to the present invention is a program that causes an information processing apparatus to execute a procedure corresponding to each of the above steps.
  • a storage medium according to the present invention stores the above program.
  • FIG. 1 is an explanatory diagram of a network including a site management terminal according to an embodiment of the present invention.
  • FIG. 2 is a block diagram of a computer device that can be used in the embodiment.
  • FIG. 2 is an explanatory diagram of a functional configuration of a site management terminal according to the embodiment. It is a figure for explaining the example of the top page of a news publishing site.
  • FIG. 4 is a diagram illustrating an example of information stored in a cluster DB.
  • FIG. 4 is a diagram illustrating an example of information stored in a keyword DB.
  • FIG. 6 is a diagram illustrating an example of information stored in a replacement word DB. It is a flowchart of attention keyword setting processing. It is a flowchart of a replacement keyword setting process.
  • FIG. 4 is an explanatory diagram illustrating an example of a set personal keyword. It is a flowchart of a web page information request reception process. It is a flowchart about the modification of a new article reception process. It is a flow chart about another modification of new arrival article reception processing.
  • the configuration of the entire network system including a site management terminal 1 that manages a news posting site according to the present embodiment will be described with reference to FIG.
  • the site management terminal 1 is capable of communicating with the distribution company terminals 3, 3,..., User terminals 4, 4,.
  • the configuration of the communication network 2 shown in FIG. 1 is not particularly limited.
  • an intranet, an extranet, a LAN (Local Area Network), a CATV (Community Antenna TeleVision) communication network, A virtual private network, a telephone line network, a mobile communication network, a satellite communication network, and the like are assumed.
  • various examples of transmission media constituting all or a part of the communication network 2 are assumed.
  • wireless even in the case of a wire such as IEEE (Institute of Electrical and Electronics Engineers) 1394, USB (Universal Serial Bus), power line carrier, telephone line, infrared rays such as IrDA (Infrared Data Association), Bluetooth (registered trademark), 802.11 wireless It can also be used by wireless such as a mobile phone network, a satellite line, and a terrestrial digital network.
  • the site management terminal 1 includes an article DB (Database) 50, a user DB 51, a cluster DB 52, a keyword DB 53, a replacement word DB 54, and the like, each of which is configured by a computer device. These devices can communicate with each other via a network such as a LAN, for example, and such a network is not particularly limited like the communication network 2.
  • a network such as a LAN, for example, and such a network is not particularly limited like the communication network 2.
  • the site management terminal 1 is provided with various functions for providing various news articles (hereinafter sometimes simply referred to as “articles”) in a state that can be browsed by a user on a web page.
  • the site management terminal 1 manages distribution articles distributed from the distribution company terminal 3 owned by the distribution company via the network 2, management of label information (genre information, etc.) given to the articles, a news posting site, and the like.
  • the site management terminal 1 is an information processing device that performs various processes on a distribution article distributed from the distribution company terminal 3. In addition, it executes various processes related to a web page as a news posting site. For example, on the basis of an HTTP (Hypertext Transfer Protocol) request from the user terminal 4, a process of generating or transmitting the corresponding web page data is performed.
  • the web page data is, for example, a structured document file such as HTML (Hypertext Markup Language) or XHTML (Extensible Hypertext Markup Language).
  • the structured document file describes text data such as news titles and article texts, image data such as images prepared for each news, and their arrangement and display mode (character color, font, size, decoration, etc.). ing. Examples of the web page include a top page of a news publication site, an individual article page on which details of each article are published, and a comment page on which comments posted on the news can be viewed.
  • the distribution company terminal 3 is an information processing device used by employees and the like belonging to the distribution company that distributes articles.
  • the distributor terminal 3 performs transmission / reception processing for distributing a new article to the site management terminal 1 and processing for correcting an already distributed article.
  • the distribution company does not need to be a company, and may be a reporter who distributes articles. Therefore, the distributor terminal 3 may be a distributor terminal used by a distributor who distributes articles.
  • the user terminal 4 is an information processing device used by the user to receive various services provided by the site management terminal 1 that manages a news posting site. Specifically, it is used when browsing a news article on a news posting site.
  • the distributor terminal 3 and the user terminal 4 are, for example, a PC (Personal Computer), a feature phone, a PDA (Personal Digital Assistants) having a communication function, or a smart device such as a smartphone or a tablet terminal.
  • FIG. 2 shows a hardware configuration of a computer device constituting each device (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, the replacement word DB 54, the distributor terminal 3, and the user terminal 4) including the site management terminal 1.
  • a CPU (Central Processing Unit) 101 of each computer device executes various processes according to a program stored in a ROM (Read Only Memory) 102 or a program loaded from a storage unit 108 into a RAM (Random Access Memory) 103. I do.
  • the RAM 103 also stores data necessary for the CPU 101 to execute various processes as appropriate.
  • the CPU 101, the ROM 102, and the RAM 103 are mutually connected via a bus 104.
  • An input / output interface 105 is also connected to the bus 104.
  • An input unit 106, an output unit 107, a storage unit 108, and a communication unit 109 are connected to the input / output interface 105.
  • the input unit 106 includes a keyboard, a mouse, a touch panel, and the like.
  • the output unit 107 includes a display including an LCD (Liquid Crystal Display), a CRT (Cathode Ray Tube), an organic EL (Electroluminescence) panel, a speaker, and the like.
  • the storage unit 108 is configured by a hard disk drive (HDD), a flash memory device, or the like.
  • the communication unit 109 performs communication processing via the network 2 and communication between devices.
  • a media drive 110 is connected to the input / output interface 105 as necessary, and a removable medium 111 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately mounted. Reading is performed.
  • each device such as the site management terminal 1 (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, the replacement word DB 54, the distributor terminal 3, and the user terminal 4) Necessary information processing and communication are executed.
  • the information processing apparatus constituting each device (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, the replacement word DB 54, the distributor terminal 3, and the user terminal 4)
  • the site management terminal 1 is a computer as shown in FIG.
  • the computer is not limited to a single device, and a plurality of computer devices may be systematized and configured.
  • the plurality of computer devices may be systemized by a LAN or the like, or may be remotely located by a VPN or the like using the Internet or the like.
  • the plurality of information processing devices may include an information processing device as a server group (cloud) that can be used by a cloud computing service.
  • Each function of the information processing apparatus is a function realized by processing executed by the CPU 101 in the information processing apparatus according to a program. However, the processing of all or some of the components described below may be realized by hardware. When each function is realized by software, each function does not need to be realized by an independent program. Processing of a plurality of functions may be executed by one program, or one function may be realized by cooperation of a plurality of program modules. Each function may be distributed to a plurality of information processing devices. Further, one of the functions may be realized by a plurality of information processing devices.
  • the site management terminal 1 includes an article management unit 1a, a user information management unit 1b, a classification processing unit 1c, a focused keyword management unit 1d, a keyword determination unit 1e, a replacement processing unit 1f, a presentation information generation unit 1g, a similarity determination unit 1h, and a presentation.
  • a section 1i, a web page generating section 1j, a request receiving section 1k, and a transmitting section 1m are provided.
  • the article management unit 1a performs various processes for managing each news article (hereinafter, also simply referred to as "article") distributed by the distributor. For example, it performs processing for receiving an article distributed from a distributor as a newly arrived article, management processing such as disclosure control based on a publication deadline for each article, and the like.
  • the publication deadline of an article can be set by a contract or the like between the distributor and the operator of the news posting site, and the article cannot be browsed after the publication deadline.
  • the user information management unit 1b performs a user management process such as a registration process of a user who uses the news posting site operated by the site management terminal 1 and a user registration cancellation process.
  • a user management process such as a registration process of a user who uses the news posting site operated by the site management terminal 1 and a user registration cancellation process.
  • the user information in the present embodiment includes constraint information.
  • the constraint information is information used to generate an article headline sentence SP suitable for a user, and is, for example, information on a user's linguistic ability and information on visual impairment.
  • the classification processing unit 1c executes a process of classifying a newly arrived article into an article cluster AC.
  • the article clusters AC are classified based on keywords included in the article details, not on the genre. That is, for example, an article of "Economic effects by the Olympics” may be classified as “Economic genre” when classified by genre, and an article of “Results of Olympic games” may be classified as "Sports genre” when classified by genre.
  • the two distribution articles can belong to the same article cluster AC. In this case, clustering across a plurality of genres is performed.
  • the genre and the article cluster AC may be substantially the same.
  • the attention keyword management unit 1d manages the attention keyword Kn for each article cluster AC.
  • the attention keyword Kn is a keyword that tends to be common to articles that are popular (for example, frequently viewed) among articles belonging to the article cluster AC. Specifically, it is a keyword often used in the article headline SP of a popular article.
  • the keyword determining unit 1e determines an appropriate keyword as a keyword used for the article heading SP of the distribution article in consideration of the constraint information of each user.
  • the determined keyword is a personal keyword Ki.
  • the attention keyword Kn may be directly used as the individual keyword Ki, or another keyword may be adopted as the individual keyword Ki based on the attention keyword Kn. The details will be described later.
  • the replacement processing unit 1f When determining the individual keyword Ki based on the keyword of interest Kn, the replacement processing unit 1f performs a replacement process on the keyword of interest Kn. That is, the target keyword Kn is replaced by another keyword having the same meaning (replacement keyword Kr) by the replacement process.
  • the replacement keyword Kr is appropriately adopted as a personal keyword Ki by the keyword determination unit 1e.
  • the presentation information generation unit 1g generates presentation information for creating the article heading SP using the personal keyword Ki.
  • the presentation information may be, for example, a plurality of personal keywords Ki.
  • the worker presented with the plurality of personal keywords Ki as the presentation information can create the article headline SP using the personal keywords Ki. That is, the presentation information is received as information for assisting creation of the article heading sentence SP.
  • the presentation information may be a candidate for an article heading sentence SP using the personal keyword Ki.
  • the worker who has been presented with a plurality of candidates for the article heading SP may select one article heading SP from among them to complete the creation of the article heading SP. That is, the work cost of creating the article heading SP is reduced.
  • the article headline SP may be created by the operator editing the presented article headline SP candidates. This can also reduce the operation cost.
  • the similarity determination unit 1h determines, for the candidate for the article heading sentence SP generated by the presentation information generating unit 1g, an article heading already posted on the news posting site in the latest predetermined period (for example, one week, one month, or one year). A similarity determination with the sentence SP is performed. If it is determined that the presentation information is similar, the presentation information generation unit 1g is notified of the fact, and is prompted to generate the presentation information again.
  • the similarity determination unit 1h may perform the same processing not only on the article headline SP candidates generated by the presentation information generation unit 1g but also on the article headline SP created by the operator. That is, for the article headline SP created by the worker, similarity determination is performed with the article headline SP already posted on the news posting site in the latest predetermined period, and when it is determined that the article headline SP is similar, the worker re-creates it. You may be made to give a prompt.
  • the presentation unit 1i performs a process of presenting the presentation information generated by the presentation information generation unit 1g to the worker. Specifically, processing such as generating web page information including presentation information and displaying the generated information on an information processing terminal used by an operator is performed.
  • the web page generation unit 1j performs a process of generating web page information such as a top page of a news posting site and an article individual page on which details of each article are posted.
  • web page information in which an article headline SP including a personal keyword Ki is posted is generated.
  • FIG. 4 shows an example of a news publishing site that is one of the web pages on which the article headline SP is published.
  • FIG. 4 shows an example of a top page (web page) of a news posting site.
  • the top page of the news posting site (hereinafter simply referred to as the top page) can be browsed using the web browser 20 operating on the user terminal 4.
  • the web browser 20 is provided with a web page display field 21, and various controls (buttons and input fields) 22, 22, 22,...
  • the web page display field 21 on which the top page is displayed is provided with an entry field 23 on which article heads SP of several news articles are posted, together with an input field and a search button for performing a search.
  • a login information display column, an advertisement display column, a weather display column, and a lead portion to other services are arranged.
  • the article headline posting location 23 is configured to have a plurality of tabs such as “General”, “Economy”, “Society”, “International”, and “Entertainment”.
  • the request receiving unit 1k performs a process of receiving a web page request from an information processing device such as the user terminal 4. Upon receiving the request, various processes for generating web page data and generating an article heading SP described below are executed.
  • the transmitting unit 1m executes a process of transmitting the generated web page data to the information processing terminal that has requested the web page. By this processing, the web page is displayed on the information processing terminal that has issued the web page request.
  • the site management terminal 1 is provided with other units required to perform processing for providing various services such as article search. Such units may be provided in an information processing device different from the site management terminal 1, or may be provided in the site management terminal 1. In addition, each unit may be realized using a plurality of information processing devices.
  • Each function as the site management terminal 1 is a function realized by processing executed by the CPU 101 of the information processing apparatus according to a program. However, the processing of all or a part of each configuration described above may be realized by hardware.
  • each function When each function is realized by software, each function does not need to be realized by an independent program. Processing of a plurality of functions may be executed by one program, or one function may be realized by cooperation of a plurality of program modules. Further, each function may be distributed to a plurality of information processing devices. Further, one of the functions may be realized by a plurality of information processing devices.
  • the site management terminal 1 includes an article DB 50, a user DB 51, a cluster DB 52, a keyword DB 53, and a replacement word DB 54.
  • the article DB 50 stores news articles distributed from a distributor. For example, an article ID that uniquely identifies an article is assigned to each distribution article, and the distribution date and time, the distributor (distributor ID), the release date, the genre ID (plurality), the image information (or image ID) and the like.
  • the image information the image data may be stored as it is, or may be stored in a state such as an image ID capable of specifying an image stored in another storage area.
  • the user DB 51 stores information on users who use various services provided by the site management terminal 1. For example, personal information such as a user name, a login password, a name, an age, a gender, an annual income, an address, an e-mail address, and a hobby is stored in association with one user ID capable of specifying one user. You. Further, the user DB 51 stores constraint information for each user.
  • the restriction information is, for example, information indicating whether the user is a “low language proficiency” user, information indicating whether the user is a “visually impaired person”, and the like. Of course, not all of this information may be stored, and the amount of stored information may differ for each user.
  • “common word” information and one or more “article ID” information are stored in association with an article cluster ID that can uniquely specify the article cluster AC (see FIG. 5).
  • the “common word” information is a keyword for determining a news article belonging to each article cluster AC. A news article whose article body contains a common keyword is classified into the article cluster AC. Note that the number of common words may be one for each article cluster AC, or may be plural. For example, 10 common words are set in the article cluster AC00001 having the article cluster ID of AC00001, and each article belonging to the article cluster AC00001 is composed of at least 4 common words out of the 10 common words in the article body. It is assumed to include.
  • the “article ID” information stores an article ID as information for specifying each article belonging to the article cluster AC.
  • the keyword DB 53 stores, in association with a noticeable keyword ID that can identify one noticeable keyword Kn, information on phrases and information on belonging article clusters (see FIG. 6).
  • the keyword “world new record” may be registered as the attention keyword Kn in the article cluster AC00001. In that case, “world new record” is registered as information of “word”.
  • “Affiliation article cluster” information is information indicating which article cluster AC the keyword of interest Kn is.
  • the keyword of interest “World New Record” is the keyword of interest in the article cluster AC00001, “AC00001”, which is the ID of the article cluster AC00001, is stored as “affiliated article cluster” information.
  • the common keyword is a keyword common to many articles belonging to the article cluster AC, it is possible that the common keyword may be the attention keyword Kn. That is, for the article cluster AC00001, the phrase "Tokyo Olympics" may be a common keyword, and may also be set as the attention keyword Kn of the article cluster AC00001.
  • the replacement keyword DB 54 stores a replacement keyword Kr that can be replaced with the target keyword (see FIG. 7). Specifically, information of the “replacement keyword Kr” and information of the “replacement condition” are linked to the target keyword ID. In the information of the “replacement keyword Kr”, a phrase that can be replaced with the attention keyword Kn specified by the attention keyword ID is stored together with the ID of the replacement keyword Kr.
  • the information of the “replacement condition” indicates a condition under which the replacement process for replacing the target keyword Kn with the replacement keyword Kr is performed. In other words, the keyword of interest Kn is selected as a word used in the article headline sentence SP of the article under a condition other than the predetermined condition. However, under the predetermined condition, the keyword of interest Kn is replaced by the replacement keyword Kr and the article headline is replaced. Used for sentence SP.
  • Examples of the replacement condition include, for example, a case where the user's language ability is low, a case where the user has visual impairment, and the like. If the information posted on the news posting site is a low-language user such as a non-native language user (that is, a foreigner) or a user with low reading ability (for example, a child), a plain word having the same meaning as the attention keyword Kn Is adopted as the article heading sentence SP.
  • a low-language user such as a non-native language user (that is, a foreigner) or a user with low reading ability (for example, a child)
  • a plain word having the same meaning as the attention keyword Kn Is adopted as the article heading sentence SP.
  • a blind user when the user is a blind person who is blind (hereinafter referred to as a blind user), it is conceivable to replace the noted keyword Kn in which a homonym exists with a replacement keyword Kr in which the homonym does not exist. This is because it is conceivable that the user obtains information by outputting the article headline sentence SP or the article body by voice.
  • the keyword of interest Kn with a large number of strokes may be replaced with a replacement keyword Kr with a small number of strokes and the same meaning. It is conceivable that replacement by the number of strokes is performed in a language using Chinese characters, such as Japanese or Chinese.
  • the replacement keyword Kr may not be prepared for all the attention keywords Kn. Further, a plurality of replacement keywords Kr may be prepared for one attention keyword Kn.
  • the acquisition (or selection) of the replacement keyword Kr corresponding to the target keyword Kn can be realized by using, for example, a DB in which synonym information is accumulated.
  • DBs are in any form as long as the information processing apparatuses constituting the site management terminal 1 can be accessed as needed. It may be realized by.
  • all of the DBs (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, and the replacement word DB 54) may be formed in the storage unit in the same system as the site management terminal 1, or each DB (the article DB 50, the user Part or all of the DB 51, the cluster DB 52, the keyword DB 53, and the replacement word DB 54) may be provided in a computer system such as a separate or remote location.
  • each DB (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, the replacement word DB 54) does not need to be formed in one device (for example, one HDD or the like). Further, each of the DBs (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, and the replacement word DB 54) does not need to be configured as one DB.
  • the information stored in the user DB 51 may be stored and managed by a plurality of user DBs (for example, a user DB for login and a user DB for storing constraint information).
  • Each of the DBs (the article DB 50, the user DB 51, the cluster DB 52, the keyword DB 53, and the replacement word DB 54) described below is merely an example of the storage unit of the information related to the processing of the embodiment in the form of one DB. Absent.
  • the attention keyword setting process is a process of setting a notice keyword Kn as a keyword to be noticed for each article cluster. This process is, for example, a process executed by the site management terminal 1 using the function of the focused keyword management unit 1d. This will be described with reference to FIG.
  • the site management terminal 1 executes a process of selecting one article cluster AC in step S101. Subsequently, in step S102, the site management terminal 1 executes a popular article identification process. In this process, an article with a large number of views is specified from among the articles belonging to the selected article cluster AC. An article with a large number of views may be determined from the total number of views from the time the article was distributed to the present, or may be normalized to the number of views per unit time. In addition, by using the number of browsing in the latest predetermined time, an article of a recent topic may be specified. Furthermore, the determination may be made based on the number of browsing while the article was posted in the article headline posting location 23 of the article posting page.
  • An article that has been viewed a lot while the article headline SP is posted in the article headline posting location 23 may include an element that the article headline SP attracts the user. Therefore, the number of views is acquired only during the period in which the article headline SP is posted, and an article with a large number of views is specified as a popular article, so that a noticeable keyword Kn effective in a noticeable keyword selection process described below is obtained. Can be selected.
  • step S103 the site management terminal 1 executes a process of acquiring the article headline sentence SP.
  • step S104 the site management terminal 1 executes a keyword extraction process.
  • a word considered as a keyword is extracted from the words constituting the acquired article headline sentence SP.
  • the keywords are, for example, nouns and verbs. This processing can be realized by using, for example, morphological analysis.
  • step S105 the site management terminal 1 executes a focused keyword selection process.
  • This process is a process of selecting, from the keywords extracted in step S104, a keyword that can contribute to an increase in the number of articles viewed, as a keyword of interest Kn.
  • a keyword common to more popular articles is selected as the attention keyword Kn.
  • the number of the attention keywords Kn is not limited to one, and a plurality of keywords may be selected.
  • step S106 the site management terminal 1 executes a process of storing the keyword of interest Kn in the keyword DB 53. By this processing, the keyword of interest Kn for each article cluster AC is stored.
  • step S107 the site management terminal 1 branches depending on whether or not there is an unprocessed article cluster AC.
  • the site management terminal 1 executes each processing of steps S101 to S107.
  • the site management terminal 1 ends the series of processes illustrated in FIG. Note that when the processing in FIG. 8 is performed, the target keyword Kn for all the article clusters AC does not have to be selected. That is, the processes of steps S101 to S107 may be executed on the article cluster AC for which the attention keyword Kn needs to be updated.
  • a replacement keyword setting process for setting a replacement keyword Kr that can be a substitute keyword for the focused keyword Kn will be described with reference to FIG.
  • the replacement keyword setting process is executed by, for example, the site management terminal 1 using the function of the replacement processing unit 1f.
  • step S201 the site management terminal 1 executes a process of acquiring one target keyword Kn. Subsequently, in step S202, the site management terminal 1 performs a process of storing a phrase having the same meaning as the keyword of interest Kn.
  • a phrase having the same meaning is a phrase used for avoiding homonyms for a blind user, for example.
  • the target keyword Kn (or a sentence including the target keyword Kn) may be transmitted by voice.
  • the keyword of interest Kn is a homonymous word
  • a plurality of meanings can be associated with the keyword.
  • a replacement keyword Kr that can be a substitute for the attention keyword Kn that is a homonym is set.
  • the replacement keyword Kr is preferably a keyword having no homonym. If the keyword of interest Kn does not have a homonym, the process of step S202 may not be performed.
  • step S202 there is a case where it is meaningful to execute step S202 even when the target keyword Kn does not have a homonymous word.
  • the language is "Japanese”
  • the keyword of interest Kn is a keyword that can be easily understood by a user who can visually recognize the character
  • a keyword that is difficult to understand only by voice for a user who cannot visually recognize the character There is a possibility of becoming.
  • the attention keyword Kn when the keyword that is not used much in daily conversation is the attention keyword Kn, the user who can visually recognize the kanji can understand the approximate meaning from the kanji included in the attention keyword Kn, but cannot recognize the kanji and cannot recognize the voice. It may take time for a blind user or the like who has to rely on the information to understand the meaning.
  • another keyword having the same meaning may be stored as the replacement keyword Kr of the target keyword Kn.
  • step S203 the site management terminal 1 performs a process of storing a plain word for replacing the keyword of interest Kn.
  • the keyword of interest Kn may be difficult for a beginner in the language to understand. It is desirable to execute step S203 when the keyword of interest Kn contains obfuscated characters or requires high reading comprehension. In other words, if the target keyword Kn is a plain keyword that does not include obfuscated characters, the processing in step S203 may not be performed. Of course, if another suitable keyword for rephrasing the target keyword Kn is not found, the plain word information storage process is not performed.
  • step S202 it is described that the replacement keyword Kr may be stored when the ease of grasping the meaning changes depending on whether or not the character can be visually recognized. It may be realized by performing. If the target keyword Kn is composed of only plain words, the process of step S203 may not be performed.
  • step S204 the site management terminal 1 performs a process of storing easily-viewable phrase information as the replacement keyword Kr of the target keyword Kn.
  • the keyword of interest Kn cannot be understood when the keyword of interest Kn contains complicated characters.
  • a complicated character is a character having a large number of strokes or a character in which the distance between lines is narrower than other words. Such characters are often found in, for example, "Japanese" and "Chinese”.
  • information on easily-viewable keywords is stored as replacement keywords Kr that can be substituted for the attention keywords Kn including complicated characters.
  • step S204 may not be performed. This may be determined, for example, based on whether or not the target keyword Kn includes characters having a predetermined number of strokes or more.
  • step S205 the site management terminal 1 determines whether there is an unprocessed keyword of interest Kn. If there is an unprocessed keyword of interest Kn, the site management terminal 1 returns to the process of step S201. When there is no unprocessed keyword of interest Kn, the site management terminal 1 ends the replacement keyword setting process shown in FIG.
  • the replacement keyword setting process illustrated in FIG. 9 information on a phrase having the same meaning, a plain phrase, or a phrase that is easy to see for each target keyword Kn is stored in the keyword DB 53 as a replacement keyword setting.
  • all words having the same meaning, plain words, and easy-to-see words may be stored, or any two of them may be stored, or any one of them may be stored.
  • the site management terminal 1 that has received the new article NA first performs a process of analyzing the article content in step S301 shown in FIG. Then, the site management terminal 1 performs a classification process of the newly arrived article NA in step S302.
  • the article content analysis process is a process of performing analysis for classifying newly arrived articles NA. For example, a keyword or the like included in the article content is extracted by performing a morphological analysis on the article content of the newly arrived article.
  • a basic model may be generated for each article cluster AC, and whether or not the article model is similar to the basic model may be determined.
  • the basic model can be generated, for example, by performing deep learning (Deep @ Learning) using the article contents of articles belonging to the same article cluster AC as teacher data.
  • the new article NA is classified into the article cluster AC according to the analysis contents. If there is no appropriate article cluster AC according to the new article NA, a new article cluster AC may be generated in the classification process.
  • the site management terminal 1 obtains, in step S303, the keyword of interest Kn of the article cluster AC to which the new article NA belongs, and in step S304, performs a process of removing the keyword of interest Kn that does not fit the article content of the new article NA.
  • step S304 is a process of excluding the attention keyword Kn unrelated to the new article NA from the attention keyword Kn acquired in step S303, and leaving only the attention keyword Kn related to the new article NA.
  • the site management terminal 1 sets a personal keyword in step S305.
  • the personal keyword setting is a process of setting a target keyword Kn in accordance with the type (restriction condition) of the restriction information possessed by the individual user.
  • the personal keyword setting process not only one attention keyword Kn is selected from the attention keywords Kn and set as the individual keyword Ki, but also another keyword may be set as the individual keyword Ki based on the attention keyword Kn. . This will be specifically described with reference to FIG.
  • the site management terminal 1 performs a process of determining the priority order of the remaining focused keywords Kn.
  • the remaining attention keywords Kn are attention keywords Kn remaining as a result of removing the attention keywords Kn unrelated to the new article NA in the above-described processing.
  • the priority order is determined, for example, according to the number of appearances in the article body of the new article NA. This is only an example, and other examples are also conceivable. For example, priorities may be set in consideration of the frequency of appearance in other articles belonging to the same article cluster AC. Further, a high priority may be given to the keyword of interest Kn used in the conclusion part of the article body of the new article NA. Furthermore, a high priority may be given to the keyword of interest Kn that enables a search for many related articles. Various other examples are also conceivable.
  • step S402 the site management terminal 1 performs a process of setting the corresponding flags for all the constraint conditions to “OFF”.
  • a process of setting the keyword of interest Kn and related words as the individual keywords Ki according to the type of the constraint information (“all blind”, “weak eyesight”, “low language ability”, etc.) is performed.
  • the information of the “correspondence flag” is used as flag information indicating whether or not the personal keyword Ki has been set for each constraint condition.
  • the personal keyword Ki since the personal keyword Ki has not been set for all the constraint conditions, it is set to OFF.
  • step S403 the site management terminal 1 selects one unprocessed keyword of interest Kn having a high priority.
  • step S404 the site management terminal 1 selects one of the constraint conditions for which the corresponding flag has been turned off, and in step S405, executes a process of determining whether or not it is necessary to respond to the constraint condition.
  • the constraint condition selected in step S404 is “low language skill” and the attention keyword Kn selected in step S403 is composed of only easy phrases, the constraint condition “low language skill” is not required. Is determined.
  • the site management terminal 1 sets the corresponding flag for the constraint to ON in step S406. On the other hand, if a response is required, the site management terminal 1 determines in step S407 whether or not there is a replacement keyword Kr corresponding to the constraint condition. That is, the replacement word DB 54 is searched to determine whether there is a replacement keyword Kr corresponding to the constraint condition and the target keyword Kn.
  • the site management terminal 1 executes a replacement keyword acquisition process in step S408, and substitutes the replacement keyword Kr in step S409. It is set as a personal keyword Ki for the constraint condition. In other words, the obtained replacement keyword Kr is set as the user's personal keyword Ki corresponding to the constraint condition.
  • the site management terminal 1 sets the corresponding flag for the restriction condition to ON.
  • step S411 the site management terminal 1 branches depending on whether there is an unselected constraint. If there is an unselected constraint, the site management terminal 1 executes the process of step S404 again. In other words, the processes of steps S404 to S410 are executed by the number of types of the constraint information. If there is no unselected constraint, the site management terminal 1 proceeds to the process of step S412.
  • step S412 there may be a case where the constraint condition determined by the replacement keyword Kr as the personal keyword Ki and the constraint condition not determined by the replacement keyword Kr coexist.
  • the constraint conditions for which the replacement keyword Kr has not been determined include those that do not require the replacement keyword Kr (those that have been determined to be “N” in step S405) and those that do.
  • the corresponding flag is set to OFF (meaning that the keyword is not supported). For such a constraint condition, consider setting a personal keyword Ki using another attention keyword Kn.
  • step S412 the site management terminal 1 sets the noticed keyword Kn, which has been a processing target in each processing of steps S404 to S410, to “processed”, and proceeds to the processing of step S413.
  • step S413 the site management terminal 1 determines whether the corresponding flags for all the constraint conditions are ON. If the corresponding flags for all the constraint conditions are ON, it is considered that appropriate personal keyword setting has been performed for each user having the constraint information, and the personal keyword setting process shown in FIG. 11 ends. On the other hand, if there is a constraint condition in which the corresponding flag is set to OFF, the site management terminal 1 returns to the process of step S403 and acquires one of the unprocessed attention keywords Kn with a higher priority, Each processing of steps S404 to S412 is executed again.
  • a personal keyword Ki is set for each constraint condition.
  • the attention keyword Kn00001 is set as a personal keyword Ki for a user who has no constraint (that is, a user who does not store constraint information).
  • a replacement keyword Kr00001 that replaces the noted keyword Kn00001 is set as the individual keyword Ki.
  • an appropriate individual keyword Ki is not set in the attention keyword Kn00001, and the replacement keyword Kr00004 of the attention keyword Kn00003 having the next highest priority is an individual keyword. It is set as Ki.
  • the noticed keyword Kn00003 is set as the individual keyword Ki.
  • the personal keyword setting process illustrated in FIG. 11 may be executed without using the priority.
  • one keyword may be randomly acquired from the keyword of interest Kn in step S403, and the processing in step S404 and subsequent steps may be performed.
  • the site management terminal 1 After setting the personal keyword Ki according to the constraint condition, the site management terminal 1 generates presentation information for each personal keyword Ki in step S306.
  • the presentation information may be the personal keyword Ki itself set in step S305, or, in addition to the personal keyword Ki, information on the purpose of the article content of the new article NA (for example, information that can be a subject such as a person or a company, Information that can be a predicate such as a verb) may be generated as the presentation information. Further, an article heading sentence SP including a personal keyword Ki may be generated and used as presentation information.
  • the site management terminal 1 performs a presentation process of presentation information in step S307.
  • the presentation information is presented to, for example, a worker who creates the article headline sentence SP.
  • the worker presented with the presentation information performs the work of creating the article headline sentence SP. Specifically, an article heading SP is created for each type of constraint information.
  • an article heading SP using the personal keyword Ki is created.
  • the article headline SP is created using the information.
  • a candidate for the article heading sentence SP is presented, an operation of selecting an article heading sentence SP to be adopted from the candidates is performed. Note that the worker may create the article heading SP from scratch without using the presented article heading SP. Even in this case, it is only necessary to select one of the article headlines SP presented for a part of the newly arrived article NA, so that the number of work steps of the worker can be reduced.
  • webpage information provided with various controls and input fields is provided so that the worker can easily perform the work of generating the article heading SP based on the presentation information. It may be configured to be presented. Specifically, it is web page information in which presentation information (such as a candidate for an article heading SP, a personal keyword Ki, and information on the purpose of the article content) is posted, and a button for starting editing, a plurality of articles, Radio buttons for selecting one of the candidates for the headline sentence SP, a text entry field for creating the headline sentence SP using the personal keyword Ki, and editing for finally determining the headline sentence SP Web page information provided with a completion button or the like is presented to the operator. Thereby, the number of work steps of the worker can be reduced.
  • presentation information such as a candidate for an article heading SP, a personal keyword Ki, and information on the purpose of the article content
  • the processing shown in FIGS. 10 and 11 and the work of creating the article heading SP by the operator are executed, for example, from the reception of the new article NA to the presentation of the article to the user. Specifically, it is performed before receiving a request for a web page on which the article headline SP of the new article NA is posted from the user terminal 4. Thereby, when a web page request is received from the user terminal 4, a web page suitable for each user can be selected by simply selecting one from several article headlines SP already prepared according to the constraint information of the user. A page is provided.
  • step S501 the site management terminal 1 that has received the request for the web page information on which the article heading SP is published performs a process of acquiring user information.
  • the user information acquired here includes constraint information.
  • advertisement information suitable for the user the user's browsing history, purchase history, or hobby / taste information may be obtained.
  • step S502 the site management terminal 1 acquires one piece of information of the article heading sentence SP together with the article information (article ID and article body).
  • step S503 the site management terminal 1 determines whether or not to use the replacement keyword Kr for the target keyword Kn used in the article heading sentence SP. This determination is made based on the constraint information of the user and the keyword of interest Kn included in the article headline sentence SP.
  • the replacement keyword Kr is not used when there is no constraint information in the user information, and that the replacement keyword Kr is used when there is the constraint information.
  • the replacement keyword Kr is not used.
  • a replacement keyword Kr may be used instead of the keyword of interest Kn for a user with "low language proficiency", but the keyword of interest Kn may be used as it is for a user with "all blindness” or "weak vision".
  • step S504 the site management terminal 1 performs a branch process according to the determination result. If the replacement keyword Kr is not used, the site management terminal 1 selects an article heading created using the keyword of interest Kn without using the replacement keyword Kr in step S505. Although this article headline SP is created for a user without constraint information, as described above, even a user having constraint information can be used for a user who has no problem using the noted keyword Kn as it is. Can be On the other hand, when using the replacement keyword Kr, the site management terminal 1 selects the article heading SP created using the replacement keyword Kr in step S506. At this time, an appropriate article heading SP is selected according to the type of the constraint information of the user.
  • step S507 the site management terminal 1 branches depending on the presence or absence of an unprocessed article heading SP. It is conceivable that a plurality of article headlines SP are provided on the same web page. For example, a web page on which the article headline SP of ten newly arrived articles NA is posted. In such a case, it is necessary to perform each of the processes in steps S502 to S506 by the number of the article headlines SP to be posted. The branch processing of step S507 is executed for that purpose.
  • step S502 If there is an unprocessed article heading SP, the site management terminal 1 executes the processing of step S502 again. On the other hand, when there is no unprocessed article heading SP, that is, when the processing for all the article headings SP is completed, the site management terminal 1 executes the web page generation processing in step S508. In this process, web page information (HTML or the like) in which each article heading SP selected so far is arranged at a predetermined position on the web page is generated.
  • HTML HyperText Markup Language
  • step S509 the site management terminal 1 performs a process of presenting web page information.
  • a web page on which the article heading SP is posted is displayed on the display unit (monitor or the like) of the user terminal 4 that has made the web page information request.
  • Modification 1 In the first modification, the site management terminal 1 creates a candidate for an article heading SP, and executes a process of determining whether the created article heading SP is not similar to an article heading SP posted in the past. If the article headings SP are the same (or similar) in spite of the fact that the contents of the articles are different, the user mistakes the article as an article that he / she has already read and loses the opportunity to obtain new information. There is a possibility that it will be. For this purpose, similarity determination between the article heading SP of the new arrival article NA and the article heading SP already posted in the past is performed.
  • the site management terminal 1 performs steps S301 to S306 to perform classification based on the article content of the newly arrived article NA, and also extracts the article of the newly arrived article NA from the attention keywords set in the classified article cluster AC.
  • the target keyword Kn according to the content is specified.
  • the personal keyword Ki is set based on the specified attention keyword Kn.
  • the individual keyword Ki can be set for each type of the constraint information of the user.
  • step S320 the site management terminal 1 that has completed the personal keyword setting process generates an article heading for each personal keyword Ki.
  • the article headline SP is generated using the individual keywords Ki and the words such as the subject (the subject) and the verb that can be the predicate of the article acquired by the article content analysis process executed in step S301. .
  • step S321 the site management terminal 1 performs a similarity determination process.
  • the similarity determination process for example, an article headline SP posted on a web page in the latest predetermined period (for example, one day or three days, or one week or one month), and an article headline sentence of a newly generated article NA generated this time
  • the SPs are compared to determine whether they are similar or not (the degree of similarity is high or low).
  • step S322 the site management terminal 1 branches according to the processing result of the similarity determination processing. That is, when it is determined that they are similar (the degree of similarity is high), the site management terminal 1 generates an article heading again in step S320. On the other hand, if it is determined that they are not similar (similarity is low), the site management terminal 1 proceeds to step S307, and performs a process of presenting the article headline SP to the worker.
  • the worker presented with the candidate for the article heading SP of the newly arrived article NA by the presentation processing can complete the article heading SP only by fine-tuning the sentence, for example, thereby reducing the number of work steps. In particular, it is possible to reduce the trouble of confirming whether a similar article heading SP has been created in the latest predetermined period.
  • the newly arrived article NA belongs to a series of articles that is a follow-up to another article, it is not necessary to perform the similarity determination with the article heading SP of the series of articles. That is, in the similarity determination processing in step S321, similarity to the article heading SP for articles other than the series of article groups may be determined.
  • step S307 the process may be switched to a process of presenting the personal keyword Ki and information of the purpose of the article content (for example, information that can be a subject such as a person or a company and information that can be a predicate such as a verb).
  • the personal keyword Ki and information of the purpose of the article content for example, information that can be a subject such as a person or a company and information that can be a predicate such as a verb.
  • an operator who creates the article heading SP creates an article using the presentation information.
  • the worker is presented with the personal keyword Ki and information on the purpose of the article content, the man-hour for creating the article heading SP can be reduced.
  • the site management terminal 1 After setting the individual keywords Ki for each type of the constraint information of the user, the site management terminal 1 performs a process of generating an article heading SP for each individual keyword Ki in step S340. Since this processing has already been described, its description is omitted.
  • step S341 the site management terminal 1 determines whether or not the number of characters of the article heading SP of the new article NA is larger than a predetermined number of characters.
  • the site management terminal 1 executes the article headline sentence generation process of step S340 again.
  • the site management terminal 1 proceeds to the process of step S307.
  • step S341 The determination process in step S341 is executed by the number of article headings SP generated in step S340. As a result, at least one article heading SP having a predetermined number of characters or less is generated, and the work of creating the article heading SP is made more efficient.
  • step S307 the personal keyword Ki and information of the purpose of the article content are obtained.
  • information that can be a subject such as a person or a company, and information that can be a predicate such as a verb may be switched to a process of presenting.
  • an operator who creates the article heading SP creates an article using the presentation information.
  • the worker is presented with the personal keyword Ki and information on the purpose of the article content, the man-hour for creating the article heading SP can be reduced.
  • the predetermined number of characters which is a threshold for limiting the number of characters
  • the predetermined number of characters is a limit for maintaining a predetermined arrangement mode of each content arranged on the web page. That is, if an article heading sentence SP having more than a predetermined number of characters is posted on a web page, the layout of the web page information may be distorted, and it may be difficult to see various kinds of posted information. For this purpose, a predetermined number of characters is limited. However, in consideration of transmitting the article headline SP by voice output to a user who cannot recognize the layout of the web page, it may not be necessary to consider the collapse of the layout.
  • the place where the predetermined number of characters is 15 may be reduced to 20 or double the number of 30 characters.
  • an excessively long sentence for example, a sentence of 100 characters
  • the time required for the user to acquire information on a plurality of article headings SP increases. This is also not preferred.
  • the site management terminal 1 is configured to present the personal keyword Ki and the information of the purpose of the article to the worker as presentation information, and the article heading SP is created by the worker. . Then, in the night time zone, the site management terminal 1 is configured to generate candidates for the article heading sentence SP and present it to the operator as presentation information, so that the operator only has to select from the candidates.
  • the man-hours of the operator are slightly consumed and the article headline SP is created. In the nighttime period, the man-hours of the worker are reduced as much as possible, and the article headline SP is reduced. Can be created.
  • the site management terminal 1 performs machine learning based on the article headline SP created by consuming the man-hours of the worker during the daytime, thereby working on the setting of the attention keyword Kn and the setting of the individual keyword Ki. Can reflect the policy of the person.
  • the site management terminal 1 may not completely create the presentation information, but may create the article headings SP completely manually. By performing the machine learning based on the article headline SP created manually in this way, it becomes possible to more reflect the policy of the worker's article headline SP.
  • the information processing apparatus as the site management terminal 1 receives the distribution article and manages it as a new article NA, and a classification process for classifying the new article NA into the article cluster AC.
  • a noticeable keyword management unit 1d that manages noticeable keywords Kn of an article cluster AC to which a popular article belongs based on keywords obtained from article headlines SP of popular articles belonging to the article cluster AC and having a high number of views, and a user.
  • a user information management unit 1b that manages user information including the constraint information of the new article NA, and an appropriate personal keyword Ki for each user based on the article cluster AC of the new article NA, the article content of the new article NA, the constraint information, and the attention keyword Kn.
  • Manually creating the article heading SP according to the article content requires a very large number of steps.
  • the keyword of interest Kn is managed for each article cluster AC, and presentation information that matches the article content is generated by using the keyword of interest Kn.
  • the presentation information include a keyword candidate that can be used for the article heading SP and a candidate for the article heading SP.
  • the man-hour required for creating the article heading sentence SP can be significantly reduced.
  • by using the attention keyword Kn for each article cluster AC it is possible to generate presentation information for creating an article headline with high click incentive that can interest the user.
  • the keyword determination unit 1e selects the first keyword (the attention keyword Kn set in the article cluster AC) according to the article cluster AC from the attention keyword Kn ( (Step 303), a second selection process (Step S304) of selecting a second keyword (excluding the attention keyword Kn that does not match the article content) according to the article content of the newly arrived article AC from the first keyword, and a second keyword And a third selection process (step S305) for selecting a personal keyword Ki according to the constraint information.
  • the target keyword Kn of the appropriate article cluster AC according to the new article NA is selected as the first keyword
  • the appropriate keyword corresponding to the article content of the new article NA is selected as the second keyword from among them.
  • an appropriate keyword is selected and determined as the personal keyword Ki according to the constraint information for each user who views the article. Therefore, the determined personal keyword Ki is appropriate for the article cluster AC of the newly arrived article NA, is in accordance with the article content, and further takes into account the constraint information of the user.
  • the keyword determination unit 1e determines the personal keyword Ki for some articles in the new article NA, and the presentation information generation unit 1g generates presentation information about some articles. You may. That is, the presentation information is not generated for all the new articles NA, but is generated for some of the new articles NA. That is, for some other newly-arrived articles NA, an article headline is manually created by an operator.
  • the information processing apparatus (the site management terminal 1) can continuously update the attention keyword Kn that is easily used in the article heading SP by learning the manual article heading SP. Accordingly, when a topic keyword or a trending keyword is added as a notable keyword Kn and presentation information for generating an article headline sentence is automatically generated, presentation information with a high click incentive that is easily noticeable is generated. can do.
  • the presentation section 1i that presents the presentation information in a state where the operation for generating the article heading sentence SP is possible may be provided. For example, some candidates for the article heading SP are posted, and a web page provided with an interface for selecting one from the candidates is presented to the operator. Further, an interface is provided for editing one selected article heading sentence candidate, and the operator can complete the article heading SP by simple operation. Therefore, it is possible to contribute to a reduction in the number of man-hours required for creating the article heading sentence SP. In addition, as a part for generating the article heading SP, a web page on which some notable keywords Kn suitable for the new article NA are published, and the article heading SP can be created based on those keywords. A web page provided with an interface capable of performing various editing may be presented to the operator.
  • the presentation information generation unit 1g may generate the article heading SP including the predetermined number of characters as the presentation information.
  • the worker who determines the article heading SP need only select one of the automatically generated article heading SP candidates. Therefore, the working efficiency is significantly improved. Further, when there is only one candidate for the article heading sentence SP, even the operation of selecting one is unnecessary, and the work efficiency is further improved. Note that, as described above, one of the article headings SP selected from the candidates for the article heading SP may be edited. As a result, both improvement in work efficiency and generation of an appropriate article heading sentence SP are achieved.
  • the similarity determination unit 1h that determines similarity between the article heading SP posted in the latest predetermined period and the article heading SP generated by the presentation information generating unit 1g is provided.
  • the information generation unit 1g may be configured to regenerate the article headline SP as the presentation information when the similarity determination unit 1h determines that they are similar.
  • similarity / dissimilarity between the article headings SP can be determined. That is, it is possible to prevent the generation of an article heading SP similar to the article heading SP already used in a different article. As a result, it is possible to eliminate the possibility that the article is erroneously recognized as an article that has already been viewed and the article is not browsed, thereby improving the browsability of the article.
  • the constraint information may be information on the language ability of the user. For example, if the same article headline SP is used for a person with high Japanese ability and a person with low ability in Japanese, the article contents estimated by the user who saw the article headline SP may differ, or in the first place, the article contents May not be able to be estimated. According to this configuration, in order to cope with such a situation, the attention keyword Kn according to the level of the language ability (that is, whether or not the user is a low language ability user) is determined as the individual keyword Ki. Therefore, it is possible to generate the article heading SP according to the language ability.
  • the constraint information may be information relating to a visual impairment of the user.
  • a visually impaired person who is completely blind may acquire the article headline SP and the information of the article body by voice.
  • An attention keyword Kn that is not suitable in such a situation is, for example, a homonym.
  • the presentation information is generated by using other words while avoiding unsuitable words such as homonyms. Therefore, it is possible to provide an environment for generating an article headline SP that is highly convenient for visually impaired persons.
  • a system with high public interest can be provided by being made available to various people.
  • the keyword determining unit 1e includes the replacement processing unit 1f that performs the replacement process (the processes in steps S407 and S408) of the target keyword Kn based on the constraint information.
  • the determined keyword may be determined as the personal keyword Ki. If the attention keyword Kn is not appropriate for some users, another attention keyword Kn may be determined as the individual keyword Ki for the user. However, according to the present configuration, according to this configuration, the attention keyword Kn is determined using other means. Presentation information for generating an article headline sentence appropriate for the user is generated. That is, another alternative keyword (substitution keyword Kr) having the same meaning as the selected attention keyword Kn (personal keyword) is set as the personal keyword Ki, and the presentation information is generated using the personal keyword Ki. Therefore, it is possible to generate an article headline Sp that is optimal for some of the users.
  • the request receiving unit 1k that receives the web page request from the terminal device (the user terminal 4), the article cluster AC to which the article belongs, and the article of the article An article headline SP for each user is obtained based on the content and the constraint information of the user who uses the terminal device (user terminal 4).
  • a web page generation unit 1j that generates information and a transmission unit 1m that transmits information of the generated web page to a terminal device (user terminal 4) may be provided.
  • the user's restriction information (for example, information indicating whether or not the user is a low language user or information indicating whether or not the user has a visual impairment) ) Is presented to the user.
  • the user can browse (or view and listen to, but describe them as "browse", including these, the appropriate article headlines SP set based on their own constraint information). Therefore, it is possible to appropriately understand the article heading sentence SP and appropriately predict the contents of the article body. That is, it is possible to reduce the possibility of browsing information of article details that the user does not want to browse due to incorrect prediction. This prevents the user from wasting time unnecessarily, and enables efficient information collection.
  • the program according to the embodiment is a program that causes an arithmetic processing device (CPU or the like) of the site management terminal 1 to execute various processes.
  • the program according to the embodiment causes an arithmetic processing device to execute an article management function of receiving a distribution article and managing the article as a new article. Further, the processing unit is caused to execute a classification processing function of classifying newly arrived articles into article clusters. Further, the arithmetic processing device is caused to execute a focused keyword management function of managing a focused keyword of an article cluster to which a popular article belongs based on a keyword acquired from an article headline of a popular article belonging to the article cluster and having a high number of views. Furthermore, the processor is caused to execute a user information management function for managing user information including restriction information on the user.
  • the arithmetic processing device is caused to execute a keyword determination function of determining an appropriate personal keyword for each user based on the article cluster of the newly arrived article, the article content of the newly arrived article, the constraint information, and the attention keyword. Then, the CPU causes the arithmetic processing device to execute a presentation information generation function of generating presentation information for generating an article headline sentence of a newly arrived article using the personal keyword. That is, this program is a program that causes the arithmetic processing unit of the information processing apparatus to execute the processes shown in FIGS. 8 to 11 and FIGS. 13 to 15.
  • the program according to the embodiment makes the arithmetic processing device execute a request receiving function of receiving a web page request from the terminal device. Further, an article headline for each user is obtained based on the article cluster to which the article belongs, the article content of the article, and the constraint information of the user who uses the terminal device, and the article headline for each user is obtained.
  • the arithmetic processing device is caused to execute a web page generation function of generating information of a web page on which a sentence is posted. Then, the processing unit is caused to execute a transmission function of transmitting the generated information of the web page to the terminal device. That is, this program is a program for causing the arithmetic processing unit of the information processing apparatus to execute the processing shown in FIG.
  • Such a program can be stored in advance in an HDD as a storage medium built in a device such as a computer device, a ROM in a microcomputer having a CPU, or the like. Alternatively, it can be temporarily (or permanently) stored in a removable storage medium such as a semiconductor memory, a memory card, an optical disk, a magneto-optical disk, or a magnetic disk. Further, such a removable storage medium can be provided as so-called package software.
  • Such a program can be installed on a personal computer or the like from a removable storage medium, or can be downloaded from a download site via a network such as a LAN or the Internet.
  • 1 site management terminal 1a article management section, 1b user information management section, 1c classification processing section, 1d attention keyword management section, 1e keyword determination section, 1f replacement processing section, 1g presentation information generation section, 1h similarity determination section, 1i presentation Section, 1j web page generation section, 2 communication network, 3 distributor terminal, 4 user terminal, 50 article DB, 51 user DB, 52 cluster DB, 53 keyword DB, 54 replacement word DB

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザごとに適した記事見出し文を生成するための環境を提供することを目的とする。そのために、情報処理装置は、配信記事を受信し新着記事として管理する記事管理部と、前記新着記事を記事クラスタに分類する分類処理部と、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えるものとした。

Description

情報処理装置、情報処理方法、プログラム、記憶媒体
 本発明は情報処理装置、情報処理方法、プログラム、記憶媒体に関し、特にニュース掲載サイトに掲載される記事の記事見出し文の生成を支援する技術に関する。
 ニュース記事を閲覧可能なウェブサイト(以降、ニュース掲載サイト)には、多数の記事群の中から閲覧者に優先的に閲覧させたい記事を提供するための特定の記事掲載場所が設けられている。
 特定の記事掲載場所は、例えば、ニュース掲載サイトのトップページに設けられている。このような特定の記事掲載場所には、記事内容を端的に説明するための記事見出し文が掲載されることがある。これは、記事全文を載せるだけのスペースが確保できないことや、多くの記事をユーザ(閲覧者)に提供することに起因する。
 ところで、このようなニュース記事ごとに記事内容を端的に表す記事見出し文を作成することは、多大なコストを要するものである。
 例えば、以下に示す特許文献1では、ウェブページの内容の要約を生成する構成が開示されている。
特開2011-100350号公報
 特許文献1に示した構成を利用すれば、ニュース記事の内容を端的に表す記事見出し文を生成することは可能かもしれない。
 しかし、このようにして生成された記事見出し文は、ユーザ(閲覧者)によらず同じ文言であり、必ずしもユーザにとって最適な文章とは限らない。
 本発明は、このような事情を鑑みてなされたものであり、ユーザごとに適した記事見出し文を生成するための環境を提供することを目的とする。
 本発明に係る情報処理装置は、配信記事を受信し新着記事として管理する記事管理部と、前記新着記事を記事クラスタに分類する分類処理部と、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えたものである。
 記事内容に即した見出し文を手動で作成することは、非常に大きな工数が必要となる。本構成によれば、記事クラスタごとに注目キーワードが管理されると共に、注目キーワードを用いて記事内容に即した提示情報が生成される。提示情報としては、例えば、記事見出し文に使えそうなキーワードの候補や、記事見出し文の候補などである。
 上述した情報処理装置の前記キーワード決定部は、前記注目キーワードから前記記事クラスタに応じた第1キーワードを選択する第1選択処理と、前記第1キーワードから前記新着記事の記事内容に応じて第2キーワードを選択する第2選択処理と、前記第2キーワードから前記制約情報に応じて前記個人キーワードを選択する第3選択処理と、を行ってもよい。
 即ち、新着記事に応じた適切な記事クラスタの注目キーワードを第1キーワードとして選択し、その中から、新着記事の記事内容に応じた適切なキーワードを第2キーワードとして選択し、更にその中から、記事を閲覧するユーザごとの制約情報に応じて適切なキーワードを個人キーワードとして選択し決定する。従って、決定された個人キーワードは、新着記事の記事クラスタに適切であり、且つ記事内容に沿ったものであり、更に、ユーザの制約情報を加味したものとなる。
 上述した情報処理装置の前記キーワード決定部は、前記新着記事における一部の記事について前記個人キーワードの決定を行い、前記提示情報生成部は、前記一部の記事についての提示情報を生成するものであってもよい。
 即ち、新着記事全てについて提示情報が生成されるのではなく、一部の新着記事について提示情報が生成される。
 上述した情報処理装置においては、記事見出し文を生成するための操作が可能な状態で前記提示情報を提示する提示部を備えたものでもよい。
 例えば、いくつかの記事見出し文の候補が掲載されると共に、候補から一つを選択することができるインタフェースを備えたウェブページが作業者に提示される。また、選択した一つの記事見出し文候補を編集できるようなインタフェースも設けられ、作業者は簡易的な操作で、記事見出し文を作成することができる。
 上述した情報処理装置の前記提示情報生成部は、前記提示情報として所定以内の文字数で構成された記事見出し文を生成してもよい。
 これにより、記事見出し文を決定する作業者は、自動で生成された記事見出し文の候補から一つを選択するだけでよい。
 上述した情報処理装置においては、直近の所定期間内に掲載された記事見出し文と前記提示情報生成部が生成した記事見出し文との類似を判定する類似判定部を備え、前記提示情報生成部は、前記類似判定部が類似と判定した場合に、前記提示情報としての記事見出し文を再生成してもよい。
 類似判定部が設けられることにより、記事見出し文同士の類似/非類似が判定可能とされる。
 上述した情報処理装置において、前記制約情報は、ユーザの言語能力に関する情報とされてもよい。
 例えば日本語の能力が高い人と低い人について、同じ記事見出し文を用いてしまうと、記事見出し文を目にしたユーザが推定した記事内容に相違が出てしまう場合や、そもそも記事内容の推定ができない場合が生じる。この構成によれば、そういった事態に対応するために、言語能力の高低に応じた注目キーワードが個人キーワードとして決定される。
 上述した情報処理装置において、前記制約情報は、ユーザの視覚障害に関する情報とされてもよい。
 例えば、全盲である視覚障害者は、記事見出し文や記事本文の情報を音声で取得することが考えられる。そのような状況で相応しくない注目キーワードとして、例えば同音異義語がある。本構成によれば、同音異義語のような適していない語句以外の注目キーワードを用いて提示情報が生成される。
 情報処理装置は、端末装置からのウェブページ要求を受信する要求受信部と、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成部と、前記生成されたウェブページの情報を前記端末装置に送信する送信部と、を備えたものでもよい。
 ユーザが記事見出し文が掲載されたウェブページを閲覧した場合に、ユーザの制約情報(例えば、低語学ユーザであるか否かの情報や視覚障害を有したユーザであるか否かを示す情報)に基づいて設定されたユーザに特化した記事見出し文がユーザに提示される。
 上述した情報処理装置においては、前記制約情報に基づいて、前記注目キーワードの置換処理を行う置換処理部を備え、前記キーワード決定部は、前記置換処理によって得られたキーワードを前記個人キーワードとして決定してもよい。
 注目キーワードが一部のユーザにとって適切でない場合、そのユーザに対しては他の注目キーワードが個人キーワードとして決定されてもよいが、本構成によれば、それ以外の手段を用いて当該ユーザに適切な記事見出し文生成のための提示情報が生成される。
 本発明に係る情報処理方法は、配信記事を受信し新着記事として管理する記事管理ステップと、前記新着記事を記事クラスタに分類する分類処理ステップと、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理ステップと、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理ステップと、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定ステップと、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成ステップと、を情報処理装置が実行するものである。
 また、本発明に係る情報処理方法は、端末装置からのウェブページ要求を受信する要求受信ステップと、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成ステップと、前記生成されたウェブページの情報を前記端末装置に送信する送信ステップと、を情報処理装置が実行するものである。
 この情報処理方法により、ユーザごとに適した記事見出し文を生成するための環境を提供することができる。
 本発明に係るプログラムは、上記各ステップに相当する手順を情報処理装置に実行させるプログラムである。本発明に係る記憶媒体は、上記プログラムを記憶したものである。これらにより上述の情報処理装置の処理を実現する。
 本発明によれば、ユーザごとに適した記事見出し文を生成するための環境を提供することができる。
本発明の実施の形態のサイト管理端末を含むネットワークの説明図である。 実施の形態で利用できるコンピュータ装置のブロック図である。 実施の形態のサイト管理端末の機能構成の説明図である。 ニュース掲載サイトのトップページの例を説明するための図である。 クラスタDBに記憶される情報の一例を示した図である。 キーワードDBに記憶される情報の一例を示した図である。 置換ワードDBに記憶される情報の一例を示した図である。 注目キーワード設定処理のフローチャートである。 置換キーワード設定処理のフローチャートである。 新着記事受信処理のフローチャートである。 個人キーワード設定処理のフローチャートである。 設定された個人キーワードの例を示す説明図である。 ウェブページ情報要求受信処理のフローチャートである。 新着記事受信処理の変形例についてのフローチャートである。 新着記事受信処理の別の変形例についてのフローチャートである。
 以下、実施の形態を次の順序で説明する。
<1.システム構成>
<2.コンピュータ装置のハードウェア構成>
<3.サイト管理端末の機能構成及びDB>
<4.各処理例>
<4-1.注目キーワード設定処理>
[4-2.置換キーワード設定処理]
[4-3.新着記事受信処理]
[4-4.ウェブページ情報要求受信処理]
<5.変形例>
[5-1.変形例1]
[5-2.変形例2]
[5-3.変形例3]
<6.まとめ>
<7.プログラム及び記憶媒体>
<1.システム構成>

 本実施の形態としてのニュース掲載サイトを管理するサイト管理端末1を含むネットワークシステム全体の構成について、図1を用いて説明する。
 サイト管理端末1は、例えばインターネット等の通信ネットワーク2を介して、配信社端末3,3,・・・ユーザ端末4,4,・・・と互いに通信可能とされている。
 なお、図1に示した通信ネットワーク2の構成は特に限定されるものではなく、上記したインターネット以外にも、例えばイントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網などが想定される。
 また、通信ネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線などの有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。
 サイト管理端末1は、それぞれコンピュータ装置で構成された記事DB(Database)50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54等を備えている。これらの各装置は、例えばLAN等のネットワークを介して互いに通信可能とされており、このようなネットワークは通信ネットワーク2と同様に特に限定されるものではない。
 サイト管理端末1は、各種のニュース記事(以降単に「記事」と記載することもある)をウェブページ上でユーザに閲覧可能な状態で提供するための各種の機能を備えている。
 例えば、サイト管理端末1は、配信社が所有する配信社端末3からネットワーク2を介して配信される配信記事の管理や、記事に付与するラベル情報(ジャンル情報など)の管理や、ニュース掲載サイトを閲覧するユーザのユーザID(Identification)やパスワードや閲覧履歴情報を管理するユーザ管理のための各種処理を行う。
 サイト管理端末1は、配信社端末3から配信されてくる配信記事についての各種処理を行う情報処理装置である。また、ニュース掲載サイトとしてのウェブページに関する各処理を実行する。例えば、ユーザ端末4からのHTTP(Hypertext Transfer Protocol)リクエストに基づいて、該当のウェブページデータの生成処理や送信処理を行う。
 ウェブページデータは、例えば、HTML(Hypertext Markup Language)やXHTML(Extensible Hypertext Markup Language)などの構造化文書ファイルである。構造化文書ファイルには、ニュースタイトルや記事本文などのテキストデータやニュースごとに用意された画像などの画像データと、それらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述されている。
 ウェブページとしては、例えば、ニュース掲載サイトのトップページや、各記事の詳細が掲載された記事個別ページや、ニュースに対して投稿されたコメントを閲覧可能なコメントページなどである。
 配信社端末3は、記事を配信する配信社に所属する社員等が使用する情報処理装置である。配信社端末3は、サイト管理端末1に対して新たな記事を配信するための送受信処理や、既に配信済みの記事を修正するための処理が行われる。
 なお、配信社は企業である必要はなく、記事の配信を行う記者であってもよい。従って、配信社端末3は記事の配信を行う配信者が使用する配信者端末であってもよい。
 ユーザ端末4は、ニュース掲載サイトを管理するサイト管理端末1が提供する各種のサービスを受けるためにユーザが使用する情報処理装置である。具体的には、ニュース掲載サイト上のニュース記事を閲覧する場合などに用いられる。
 配信社端末3やユーザ端末4は、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistants)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどである。
<2.コンピュータ装置のハードウェア構成>

 サイト管理端末1をはじめとした各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)を構成するコンピュータ装置のハードウェア構成を図2に示す。各コンピュータ装置のCPU(Central Processing Unit)101は、ROM( Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM( Random Access Memory )103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
 CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
 入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
 入力部106はキーボード、マウス、タッチパネルなどにより構成される。
 出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
 記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
 通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
 入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
 このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われる。またリムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
 CPU101が各種のプログラムに基づいて処理動作を行うことで、サイト管理端末1などの各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)としての必要な情報処理や通信が実行される。
 なお、サイト管理端末1などの各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
 情報処理装置の各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部または一部の各構成の処理をハードウェアにより実現してもよい。
 また各機能をソフトウェアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。一つのプログラムにより複数の機能の処理が実行されてもよいし、一つの機能が複数のプログラムモジュールの連携で実現されてもよい。
 また各機能は複数の情報処理装置に分散されていてもよい。更に機能の一つが、複数の情報処理装置によって実現されてもよい。
<3.サイト管理端末の機能構成及びDB>

 サイト管理端末1の具体的な構成について、図3を参照して説明する。
 サイト管理端末1は、記事管理部1a、ユーザ情報管理部1b、分類処理部1c、注目キーワード管理部1d、キーワード決定部1e、置換処理部1f、提示情報生成部1g、類似判定部1h、提示部1i、ウェブページ生成部1j、要求受信部1k、送信部1mを備えている。
 記事管理部1aは、配信社によって配信された各ニュース記事(以降、単に「記事」ともいう)を管理するための各種処理を行う。
 例えば、配信社から配信された記事を新着記事として受信するための処理や、記事ごとの公開期限に基づく公開制御などの管理処理などを行う。
 記事の公開期限は、配信社とニュース掲載サイトの運営者の間の契約等により設定され得るものであり、公開期限を過ぎると記事の閲覧が不能とされる。
 ユーザ情報管理部1bは、サイト管理端末1によって運営されるニュース掲載サイトを利用するユーザの登録処理やユーザ登録の解除処理などのユーザ管理処理を行う。
 詳細は後述するが、本実施の形態におけるユーザ情報には、制約情報が含まれる。制約情報とは、ユーザに適した記事見出し文SPを生成するために用いられる情報であり、ユーザの言語能力情報や視覚障害情報などである。
 分類処理部1cは、新着記事を記事クラスタACに分類する処理を実行する。特に、本実施の形態では、記事クラスタACはジャンルではなく、記事詳細に含まれるキーワードに基づいて分類される。即ち、例えば、「オリンピックによる経済効果」の記事はジャンルで分類すると「経済ジャンル」とされ、「オリンピック競技の結果」の記事はジャンルで分類すると「スポーツジャンル」とされる可能性がある。しかし、「オリンピック」というキーワードを元に記事クラスタACを生成することにより、上記二つの配信記事は同一の記事クラスタACに属することが可能となる。この場合には、複数のジャンルを横断したクラスタリングが行われる。
 なお、勿論、ジャンルと記事クラスタACが略同一のものとされていてもよい。
 注目キーワード管理部1dは、記事クラスタACごとに注目キーワードKnを管理する。
 注目キーワードKnは、記事クラスタACに属する記事の中で人気が高い(例えば閲覧数が多い)記事に共通しがちなキーワードである。具体的には、人気記事の記事見出し文SPに採用されることの多いキーワードである。
 キーワード決定部1eは、配信記事の記事見出し文SPに用いるキーワードとして適切なキーワードを各ユーザの制約情報を考慮して決定する。該決定されたキーワードは、個人キーワードKiとされる。注目キーワードKnをそのまま個人キーワードKiとして採用してもよいし、注目キーワードKnに基づいて別のキーワードを個人キーワードKiとして採用してもよい。具体的には後述する。
 置換処理部1fは、注目キーワードKnに基づいて個人キーワードKiを決定する際に、注目キーワードKnの置換処理を行う。即ち、注目キーワードKnを置換処理によって同じ意味の別のキーワード(置換キーワードKr)に置き換える。
 置換キーワードKrは、キーワード決定部1eによって、適宜、個人キーワードKiとして採用される。
 提示情報生成部1gは、個人キーワードKiを用いて、記事見出し文SPを作成するための提示情報を生成する。提示情報は、例えば、複数の個人キーワードKiとされていてもよい。複数の個人キーワードKiを提示情報として提示された作業者は、個人キーワードKiを用いて記事見出し文SPを作成することができる。即ち、記事見出し文SPの作成を補助するための情報として提示情報を受け取る。
 また、提示情報は、個人キーワードKiを用いた記事見出し文SPの候補であってもよい。記事見出し文SPの候補を複数提示された作業者は、その中から一つの記事見出し文SPを選択することにより、記事見出し文SPの作成を完了してもよい。即ち、記事見出し文SPの作成の作業コストの低減が図られる。なお、提示された記事見出し文SPの候補を作業者が編集することにより、記事見出し文SPの作成を行ってもよい。これによっても、作業コストの低減を図ることができる。
 類似判定部1hは、提示情報生成部1gが生成した記事見出し文SPの候補について、直近の所定期間(例えば1週間や1ヶ月、或いは1年など)に既にニュース掲載サイトに掲載された記事見出し文SPとの類似判定を行う。類似と判定された場合は、提示情報生成部1gにその旨を通知し、再度提示情報の生成を行うように促す。
 また、類似判定部1hは、提示情報生成部1gが生成した記事見出し文SPの候補だけでなく、作業者が作成した記事見出し文SPについて同様の処理を行ってもよい。即ち、作業者が作成した記事見出し文SPについて、直近の所定期間に既にニュース掲載サイトに掲載された記事見出し文SPとの類似判定を行い、類似と判定された場合に作業者に再作成を促す通知を行うようにしてもよい。
 提示部1iは、提示情報生成部1gが生成した提示情報を作業者に対して提示する処理を行う。具体的には、提示情報が含まれるウェブページ情報などを生成して作業者が使用する情報処理端末上に表示させる処理などを行う。
 ウェブページ生成部1jは、ニュース掲載サイトのトップページや、各記事の詳細が掲載された記事個別ページなどのウェブページ情報を生成する処理を行う。
 本実施の形態では、個人キーワードKiを含む記事見出し文SPが掲載されたウェブページ情報を生成する。
 図4に記事見出し文SPが掲載されたウェブページの一つとされたニュース掲載サイトの一例を示す。
 図4は、ニュース掲載サイトのトップページ(ウェブページ)の一例を示したものである。
 ニュース掲載サイトのトップページ(以降、単にトップページと記載)は、ユーザ端末4上で動作するウェブブラウザ20を用いて閲覧可能である。ウェブブラウザ20には、ウェブページ表示欄21が設けられ、その上部や側部には各種の操作子(ボタンや入力欄)22,22,22・・・が設けられている。
 トップページが表示されるウェブページ表示欄21には、検索を行うための入力欄や検索ボタンと共に、いくつかのニュース記事の記事見出し文SPが掲載される記事見出し文掲載場所23が設けられている。
 記事見出し文掲載場所23の周辺には、ログイン情報表示欄や広告表示欄、天候表示欄、他サービスへの導線部が配置されている。
 記事見出し文掲載場所23は、例えば「総合」、「経済」、「社会」、「国際」、「芸能」などの複数のタブを有して構成されている。
 要求受信部1kは、ユーザ端末4などの情報処理装置からウェブページの要求を受信する処理を行う。要求を受信することにより、ウェブページデータの生成や後述する記事見出し文SPを生成するための各処理が実行される。
 送信部1mは、ウェブページの要求があった情報処理端末に対して、生成したウェブページデータを送信する処理を実行する。この処理により、ウェブページ要求を行った情報処理端末上にウェブページが表示される。
 サイト管理端末1には、他にも、記事検索などの各種サービスを提供するための処理を行うために必要な各部が設けられている。
 このような各部は、サイト管理端末1とは異なる情報処理装置に設けられていてもよいし、サイト管理端末1に設けられていてもよい。また、複数の情報処理装置を利用して各部の実現が可能とされていてもよい。
 尚、サイト管理端末1としての各機能は、情報処理装置におけるCPU101でプログラムに応じて実行される処理により実現される機能である。但し上記の全部又は一部の各構成の処理をハードウェアにより実現してもよい。
 また各機能をソフトウェアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。一つのプログラムにより複数の機能の処理が実行されてもよいし、一つの機能が複数のプログラムモジュールの連携で実現されてもよい。
 また、各機能は複数の情報処理装置に分散されていてもよい。更に、機能の一つが複数の情報処理装置によって実現されていてもよい。
 サイト管理端末1が上記の各種機能を実現するために、サイト管理端末1は、記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54を備えている。
 記事DB50には、配信社から配信されるニュース記事が記憶されている。例えば、配信記事ごとに記事を一意に特定可能な記事IDが付与され、該記事IDごとに配信日時、配信社(配信社ID)、公開期限、ジャンルID(複数可)、画像情報(もしくは画像ID)等が紐付けられている。
 画像情報は、画像データがそのまま記憶されていてもよいし、別の記憶領域に保存された画像を特定可能な画像IDなどの状態で記憶されていてもよい。
 ユーザDB51には、サイト管理端末1が提供する各種サービスを利用するユーザの情報が記憶される。例えば、一人のユーザを特定可能な一つのユーザIDに対して、ユーザ名、ログインパスワード、氏名、年齢、性別、年収、住所、メールアドレス、趣味などの個人的な情報が紐付けられて記憶される。
 更に、ユーザDB51には、ユーザごとの制約情報が記憶される。制約情報とは、例えば「低語学力」ユーザであるか否かを示す情報や「視覚障害者」であるか否かを示す情報などである。
 勿論、これらの情報の全てが記憶されていなくてもよく、記憶された情報量がユーザごとに異なっていてもよい。
 クラスタDB52には、記事クラスタACを一意に特定可能な記事クラスタIDに対して、「共通ワード」情報と一つ以上の「記事ID」情報が紐付けられて記憶されている(図5参照)。
 「共通ワード」情報は、各記事クラスタACに属するニュース記事を判定するためのキーワードである。記事本文に共通キーワードが含まれたニュース記事は、該記事クラスタACに分類される。
 なお、共通ワードは記事クラスタACごとに一つとされていてもよいし、複数とされていてもよい。例えば記事クラスタIDがAC00001とされた記事クラスタAC00001に10個の共通ワードが設定されており、記事クラスタAC00001に属する各記事は、10個の共通ワードのうち少なくとも4個以上の共通ワードを記事本文に含むものとされている。
 「記事ID」情報は、記事クラスタACに属する各記事を特定するための情報として記事のIDが記憶されている。
 キーワードDB53には、一つの注目キーワードKnを特定可能な注目キーワードIDに対して、語句の情報と所属記事クラスタの情報が紐付けられて記憶されている(図6参照)。
 語句とは、注目キーワードKnとして登録されているキーワードの文字列を指している。例えば、「東京オリンピック」という共通ワードが含まれることにより記事クラスタAC00001に属する各記事(記事ID=AID000001,AID000002,AID000003,・・・)において、該記事群の記事見出し文SPに頻繁に登場する「世界新記録」というキーワードがある場合、「世界新記録」というキーワードは記事クラスタAC00001における注目キーワードKnとして登録されることが考えられる。
 その場合には、「語句」の情報として「世界新記録」が登録される。
 「所属記事クラスタ」情報は、注目キーワードKnが何れの記事クラスタACのものであるかを示す情報である。上記の例では、「世界新記録」の注目キーワードKnは記事クラスタAC00001における注目キーワードKnであるため、「所属記事クラスタ」情報として記事クラスタAC00001のIDである「AC00001」が記憶される。
 なお、共通キーワードは、記事クラスタACに属する多くの記事に共通するキーワードであるため、注目キーワードKnである可能性も考えられる。即ち、記事クラスタAC00001にとって「東京オリンピック」という語句は、共通キーワードであると共に、記事クラスタAC00001の注目キーワードKnとされていてもよい。
 置換ワードDB54には、注目キーワードとの置き換えが可能な置換キーワードKrが記憶されている(図7参照)。
 具体的には、注目キーワードIDに対して、「置換キーワードKr」の情報と「置換条件」の情報が紐付けられている。
 「置換キーワードKr」の情報は、注目キーワードIDによって特定される注目キーワードKnとの置換が可能な語句が置換キーワードKrのIDと共に記憶されている。「置換条件」の情報は、注目キーワードKnを置換キーワードKrに置き換える置換処理が実行される条件を示している。換言すれば、所定の条件以外では、記事の記事見出し文SPに使用される文言として注目キーワードKnが選択されるが、所定の条件下においては注目キーワードKnが置換キーワードKrに置き換えられて記事見出し文SPに使用される。
 置換条件の一例としては、例えば、ユーザの語学力が低い場合やユーザが視覚障害を有している場合などである。
 ニュース掲載サイトに掲載される情報が母国語でないユーザ(即ち外国人)や読解力の低いユーザ(例えば子供)など、低語学力ユーザである場合には、注目キーワードKnと同じ意味の平易な言葉である置換キーワードKrが記事見出し文SPに採用される。
 また、ユーザが全盲の視覚障害者(以降、全盲ユーザと記載)である場合には、同音異義語が存在する注目キーワードKnを同音異義語が存在しない置換キーワードKrに置き換えることが考えられる。これは、記事見出し文SPや記事本文を音声出力することにより、ユーザが情報を得ることが考えられるからである。
 他にも、ユーザが弱視の視覚障害者(以降、弱視ユーザと記載)である場合には、画数の多い注目キーワードKnを画数の少ない同じ意味の置換キーワードKrに置き換えてもよい。画数による置き換えは、例えば日本語や中国語など、漢字を用いる言語で行われることが考えられる。
 もちろん、全ての注目キーワードKnに対して置換キーワードKrが用意されていなくてもよい。また、一つの注目キーワードKnに対して複数の置換キーワードKrが用意されていてもよい。
 注目キーワードKnに対応した置換キーワードKrの取得(或いは選択)は、例えば、類義語情報を集積したDBなどを用いることにより実現可能である。
 これらの各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)は、サイト管理端末1を構成する各情報処理装置が必要に応じてアクセス可能とされていればどのような形態で実現されていてもよい。例えばサイト管理端末1と同一システム内の記憶部に各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)のすべてが形成されていてもよいし、各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)の一部又は全部が別体、遠隔地等のコンピュータシステムに設けられていてもよい。もちろん各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)が一つの装置(例えば一つのHDD等)内に形成されている必要はない。また各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)のそれぞれが、それぞれ1つのDBとして構成される必要もない。例えばユーザDB51に記憶される情報が、複数のユーザDB(例えばログイン用のユーザDBと制約情報が記憶されるユーザDBなど)により記憶管理されてもよい。以下説明する各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)は、実施の形態の処理に関連する情報の記憶部を、それぞれ1つのDBの形態で例示したものに過ぎない。
<4.各処理例>

 サイト管理端末1が実行する各種の処理の一例について、各図を参照しながら説明する。
<4-1.注目キーワード設定処理>
 注目キーワード設定処理は、記事クラスタごとに注目されるキーワードとしての注目キーワードKnを設定する処理である。この処理は、例えば、サイト管理端末1が注目キーワード管理部1dの機能を用いて実行する処理である。図8を参照して説明する。
 サイト管理端末1は、ステップS101で、一つの記事クラスタACを選択する処理を実行する。
 続いて、サイト管理端末1はステップS102で、人気記事特定処理を実行する。この処理では、選択された記事クラスタACに属する各記事の中から閲覧数が多い記事を特定する。閲覧数が多い記事は、記事が配信されてから現在までの総閲覧数から判定してもよいし、単位時間あたりの閲覧数に正規化してもよい。また、直近の所定時間における閲覧数とすることにより、最近話題の記事を特定してもよい。更には、記事掲載ページの記事見出し文掲載場所23に記事が掲載されていた間の閲覧数から判定してもよい。記事見出し文掲載場所23に記事見出し文SPが掲載されている間に多くの閲覧があった記事は、記事見出し文SPがユーザを引きつける要素を含んでいることが考えられる。従って、記事見出し文SPが掲載されていた期間に限定して閲覧数を取得し、その閲覧数が多い記事を人気記事と特定することにより、後述の注目キーワード選定処理において効果的な注目キーワードKnを選定することができる。
 サイト管理端末1はステップS103で、記事見出し文SPを取得する処理を実行する。
 次に、サイト管理端末1はステップS104で、キーワード抽出処理を実行する。この処理では、取得した記事見出し文SPを構成する語句からキーワードと思われる単語を抽出する。キーワードとしては、例えば、名詞や動詞などである。この処理は、例えば、形態素解析を用いることにより実現可能である。
 サイト管理端末1はステップS105で、注目キーワード選定処理を実行する。
 この処理では、ステップS104で抽出したキーワードの中から、記事の閲覧数の増加に寄与し得るキーワードを注目キーワードKnとして選定する処理である。例えば、より多くの人気記事に共通するキーワードなどを注目キーワードKnとして選定する。
 なお、注目キーワードKnは一つに限らず複数個選定されてもよい。
 サイト管理端末1はステップS106で、注目キーワードKnをキーワードDB53に記憶する処理を実行する。この処理により、記事クラスタACごとの注目キーワードKnが記憶される。
 サイト管理端末1はステップS107で、未処理の記事クラスタACがあるか否かに応じて分岐する。
 未処理の記事クラスタACがある場合、サイト管理端末1はステップS101乃至S107の各処理を実行する。
 一方、未処理の記事クラスタACがない場合、サイト管理端末1は図8に示す一連の処理を終了させる。
 なお、図8の処理を行った場合に、全ての記事クラスタACについての注目キーワードKnが選定されなくてもよい。即ち、注目キーワードKnの更新が必要となった記事クラスタACを処理対象として、ステップS101乃至S107の各処理を実行してもよい。
[4-2.置換キーワード設定処理]
 注目キーワードKnの代替のキーワードとなりうる置換キーワードKrを設定する置換キーワード設定処理について、図9を参照して説明する。
 なお、置換キーワード設定処理は、例えば、サイト管理端末1が置換処理部1fの機能を用いて実行する。
 サイト管理端末1はステップS201で、注目キーワードKnを一つ取得する処理を実行する。
 続いて、サイト管理端末1はステップS202で、注目キーワードKnと同じ意味を持つ語句を記憶する処理を行う。
 同じ意味を持つ語句は、例えば全盲ユーザのために同音異義語を避けるために用いられる語句である。例えば、全盲ユーザに対して注目キーワードKnの意味を伝達したい場合に、音声によって注目キーワードKn(或いは注目キーワードKnを含む文章)を伝達することが考えられる。このとき、注目キーワードKnが同音異義語である場合には複数の意味が連想され得るため、音声出力に適さない場合がある。そこで、同音異義語である注目キーワードKnの代替となり得る置換キーワードKrの設定がステップS202で行われる。
 即ち、ステップS202の処理は、同音異義語を避けるための代替キーワードを設定するものであるため、置換キーワードKrは同音異義語を有さないキーワードであることが望ましい。
 なお、注目キーワードKnが同音異義語を有さない場合は、ステップS202の処理を行わなくてもよい。
 他にも、注目キーワードKnが同音異義語を有さない場合であってもステップS202を実行することに意味がある場合もある。
 例えば言語が「日本語」である場合に、文字を視認可能なユーザにとっては、注目キーワードKnが容易に理解できるキーワードだったとしても、文字を視認できないユーザにとっては音声だけでは理解しにくいキーワードとなってしまう可能性がある。具体的には、日常会話で余り使用されないキーワードが注目キーワードKnであった場合、漢字を視認できるユーザにとっては注目キーワードKnに含まれる漢字からおおよその意味を把握できるが、漢字を視認できず音声に頼らざるを得ない全盲ユーザなどにとっては意味の把握に時間を要することが考えられる。そのような場合に、ステップS202の処理を行うことにより、同じ意味の別のキーワードを注目キーワードKnの置換キーワードKrとして記憶してもよい。
 サイト管理端末1はステップS203で、注目キーワードKnを置き換えるための平易な語句を記憶する処理を行う。
 例えば、注目キーワードKnがその言語における初学者にとっては理解しにくいことがある。注目キーワードKnが難読文字を含む場合や高い読解力を要するものである場合にステップS203を実行することが望ましい。
 換言すれば、注目キーワードKnが難読文字を含まず平易なキーワードである場合は、ステップS203の処理を行わなくてもよい。勿論、注目キーワードKnを言い換えるための適切な別のキーワードが見つからない場合は、平易な語句情報の記憶処理は行われない。
 なお、ステップS202では、文字の視認の可否で意味の把握の容易さが変わる場合などに、置換キーワードKrを記憶してもよい旨を記載したが、このような処理は、ステップS203の処理を行うことにより実現してもよい。
 注目キーワードKnが平易な語句のみで構成されている場合には、ステップS203の処理を行わなくてもよい。
 サイト管理端末1はステップS204で、注目キーワードKnの置換キーワードKrとして見やすい語句情報を記憶する処理を行う。
 文字が完全に見えないわけではなくある程度は見える弱視ユーザにとっては、例えば、注目キーワードKnが込み入った文字を含んでいる場合に注目キーワードKnの理解ができないことが考えられる。
 込み入った文字とは、画数の多い文字や線と線の間隔が他の語句と比べて狭い文字などである。このような文字は、例えば「日本語」や「中国語」などに多く見られるものである。
 ステップS204の処理では、込み入った文字を含む注目キーワードKnの代替となり得る置換キーワードKrとして、見やすいキーワードの情報が記憶される。
 注目キーワードKnが既に見やすい語句のみで構成されている場合には、ステップS204の処理は行わなくてもよい。これは、例えば、注目キーワードKnに所定数以上の画数とされた文字が含まれているか否かによって判定することが考えられる。
 サイト管理端末1はステップS205で、未処理の注目キーワードKnがあるか否かを判定する。未処理の注目キーワードKnがある場合、サイト管理端末1はステップS201の処理に戻る。
 未処理の注目キーワードKnがない場合、サイト管理端末1は図9に示す置換キーワード設定処理を終了する。
 図9に示す置換キーワード設定処理を実行することにより、注目キーワードKn一つ一つに対して同じ意味の語句や平易な語句、或いは見やすい語句の情報が置換キーワード設定としてキーワードDB53に記憶される。
 勿論、注目キーワードKnによっては、同じ意味の語句、平易な語句、見やすい語句の全てが記憶される場合もあれば、その何れか二つが記憶される場合、何れか一つが記憶される場合もある。また、置換キーワードKrが設定されない注目キーワードKnもある。
[4-3.新着記事受信処理]
 新着記事受信処理は、配信者端末3から通信ネットワーク2を介して配信されてくる新着記事NAを受信したことに応じて、該新着記事NAをユーザに提示するための処理を行う。この処理は、例えば、サイト管理端末1が記事管理部1aや分類処理部1cやキーワード決定部1eや置換処理部1fや提示情報生成部1gや提示部1iの機能を用いて実行するものである。
 以下、図10及び図11を参照しながら説明する。
 新着記事NAを受信したサイト管理端末1は、先ず図10に示すステップS301において、記事内容を解析する処理を行う。そして、サイト管理端末1はステップS302で新着記事NAの分類処理を行う。
 記事内容解析処理は、新着記事NAを分類するための解析を行う処理である。例えば、新着記事の記事内容を形態素解析することにより、記事内容に含まれるキーワード等を抽出する。また、記事クラスタACごとに基本モデルを生成し、基本モデルと類似しているか否かを判定してもよい。基本モデルは、例えば、同じ記事クラスタACに属する記事の記事内容を教師データとしたディープラーニング(Deep Learning)を行うことによって生成することが可能である。
 新着記事NAの分類処理では、解析内容に応じて新着記事NAを記事クラスタACに分類する処理である。新着記事NAに応じた適切な記事クラスタACがない場合には、分類処理において新たな記事クラスタACを生成してもよい。
 サイト管理端末1は、ステップS303で、新着記事NAが属する記事クラスタACの注目キーワードKnを取得し、ステップS304で、新着記事NAの記事内容にそぐわない注目キーワードKnを除く処理を行う。
 記事クラスタACには、多様なキーワードが注目キーワードKnとして設定されている。その中には、記事クラスタACに属する全ての記事に関連する注目キーワードKnもあれば、記事クラスタACに属する一部の記事に関連する注目キーワードKnもある。ステップS304の処理では、ステップS303で取得した注目キーワードKnから新着記事NAとは無関係の注目キーワードKnを除き、新着記事NAに関係のある注目キーワードKnのみを残す処理である。
 サイト管理端末1はステップS305で、個人キーワード設定を行う。個人キーワード設定とは、個人個人のユーザが持っている制約情報の種別(制約条件)に応じた注目キーワードKnを設定する処理である。なお、個人キーワード設定処理では、注目キーワードKnから一つの注目キーワードKnを選択して個人キーワードKiとして設定するだけでなく、注目キーワードKnに基づいて他のキーワードを個人キーワードKiとして設定することもある。
 具体的に、図11を参照して説明する。
 個人キーワード設定処理において、サイト管理端末1はステップS401で、残った注目キーワードKnの優先順位を決定する処理を行う。
 残った注目キーワードKnとは前述の処理で新着記事NAとは無関係の注目キーワードKnを除いた結果残った注目キーワードKnである。
 優先順位は、例えば、新着記事NAの記事本文に出現する出現回数に応じて決定する。なお、これはあくまで一例であり、他の例も考えられる。例えば、同じ記事クラスタACに属する他の記事における出現頻度も考慮して優先順位を付けてもよい。また、新着記事NAの記事本文の結論部分に用いられた注目キーワードKnに高い優先度を付与してもよい。更には、関連記事が多く検索できるような注目キーワードKnに高い優先度を付与してもよい。他にも各種の例が考えられる。
 サイト管理端末1はステップS402で、全ての制約条件についての対応済フラグを「OFF」に設定する処理を行う。
 以降の処理では、制約情報の種別(「全盲」、「弱視」、「低語学力」など)に応じて注目キーワードKnや関連語を個人キーワードKiとして設定する処理を行う。「対応済フラグ」の情報は、制約条件ごとに個人キーワードKiの設定が行われたか否かを示すフラグ情報として用いられる。ここでは、全ての制約条件について個人キーワードKiの設定がまだ行われていないため、OFFとするものである。
 サイト管理端末1はステップS403で、優先度の高い未処理の注目キーワードKnを一つ選択する。
 サイト管理端末1はステップS404で、対応済フラグがOFFとされた制約条件を一つ選択し、ステップS405で、制約条件への対応が必要か否かを判定する処理を実行する。
 例えば、ステップS404で選択した制約条件が「低語学力」であり、ステップS403で選択した注目キーワードKnが容易な語句のみで構成されている場合、「低語学力」という制約条件については対応不要と判定する。
 選択した制約条件への対応が不要である場合、サイト管理端末1はステップS406で当該制約条件についての対応済フラグをONに設定する。
 一方、対応が必要である場合、サイト管理端末1はステップS407で制約条件に対応する置換キーワードKrの有無を判定する。即ち、置換ワードDB54を検索し、制約条件及び注目キーワードKnに対応した置換キーワードKrの有無を判定する。
 選択した制約条件及び注目キーワードKnに対応した置換キーワードKrが置換ワードDB54に記憶されている場合、サイト管理端末1はステップS408で置換キーワード取得処理を実行し、ステップS409で置換キーワードKrを該当の制約条件についての個人キーワードKiとして設定する。換言すれば、取得した置換キーワードKrを制約条件に該当するユーザの個人キーワードKiとして設定する。
 サイト管理端末1はステップS410で当該制約条件についての対応済フラグをONに設定する。
 一方、選択した制約条件及び注目キーワードKnに対応する置換キーワードKrが置換ワードDB54に記憶されていない場合、対応済フラグはOFFのままとし、サイト管理端末1は次の処理(ステップS411)へと遷移する。
 ステップS411では、サイト管理端末1は未選択の制約条件があるか否かに応じて分岐する。未選択の制約条件がある場合、サイト管理端末1は再びステップS404の処理を実行する。即ち、制約情報の種類の数だけステップS404乃至ステップS410の各処理を実行する。
 未選択の制約条件がない場合、サイト管理端末1はステップS412の処理へと進む。
 ステップS412の処理を実行する段階においては、個人キーワードKiとしての置換キーワードKrが決定した制約条件と、置換キーワードKrが決定していない制約条件が共存した状態とされている場合がある。また、置換キーワードKrが決定していない制約条件には、置換キーワードKrが不要なもの(ステップS405で「N」と判定されたもの)と必要なものがある。置換キーワードKrが必要であるにも関わらず個人キーワードKiとしての置換キーワードKrが決定していない制約条件は、対応済フラグがOFF(未対応を意味する)とされている。
 このような制約条件については、他の注目キーワードKnを用いて個人キーワードKiを設定することを考える。
 ステップS412では、サイト管理端末1はステップS404乃至ステップS410の各処理で処理対象となった注目キーワードKnを処理済みに設定し、ステップS413の処理へ遷移する。
 サイト管理端末1はステップS413で、全ての制約条件についての対応済フラグがONであるか否かを判定する。
 全ての制約条件についての対応済みフラグがONである場合、制約情報を備えたそれぞれのユーザごとに適切な個人キーワード設定が行われたと見なし、図11に示す個人キーワード設定処理を終了する。
 一方、対応済みフラグがOFFとされた制約条件がある場合、サイト管理端末1はステップS403の処理へ戻り未処理とされた注目キーワードKnのうち、優先度の高いものを更に一つ取得し、ステップS404乃至ステップS412の各処理を再度実行する。
 図11の処理を実行することにより、制約条件ごとに個人キーワードKiが設定される。具体的な例を図12に示す。
 制約条件がないユーザ(即ち制約情報が記憶されていないユーザ)には、注目キーワードKn00001が個人キーワードKiとして設定されている。また、「低語学力」であることが制約情報として記憶されたユーザについては、注目キーワードKn00001を置換した置換キーワードKr00001が個人キーワードKiとして設定されている。
 また、「弱視」であることが制約情報として記憶されたユーザについては、注目キーワードKn00001では適切な個人キーワードKiが設定されず、次に優先度の高かった注目キーワードKn00003の置換キーワードKr00004が個人キーワードKiとして設定されている。
 更に、「全盲」であることが制約情報として記憶されたユーザについては、注目キーワードKn00003が個人キーワードKiとして設定されている。
 なお、ステップS401で注目キーワードKnごとに優先度を付与する例を説明したが、優先度を用いずに図11に示す個人キーワード設定処理を実行してもよい。例えば、ステップS403で注目キーワードKnからランダムに一つのキーワードを取得し、ステップS404以降の処理を行ってもよい。
 これにより、同じような注目キーワードKnが個人キーワードKiとして設定されてしまうことを防止することができる。
 図10の説明に戻る。
 制約条件に応じた個人キーワードKiを設定した後、サイト管理端末1はステップS306で個人キーワードKiごとの提示情報を生成する。
 提示情報としては、ステップS305で設定した個人キーワードKiそのものであってもよいし、個人キーワードKiに加えて、新着記事NAの記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示情報として生成してもよい。
 また、個人キーワードKiを含む記事見出し文SPを生成し、提示情報としてもよい。
 サイト管理端末1はステップS307で提示情報の提示処理を行う。これにより、例えば記事見出し文SPを作成する作業者などに提示情報が提示される。
 提示情報を提示された作業者は、記事見出し文SPを作成する作業を行う。具体的には、制約情報の種別ごとに記事見出し文SPを作成する。個人キーワードKiが提示情報として提示された場合には、個人キーワードKiを用いた記事見出し文SPを作成する。また、個人キーワードKiと主語述語が提示された場合には、それらの情報を用いて記事見出し文SPを作成する。更に、記事見出し文SPの候補が提示された場合には、その中から採用する記事見出し文SPを選択する作業を行う。なお、提示された記事見出し文SPを採用せずに作業者が一から記事見出し文SPを作成してもよい。
 この場合であっても、新着記事NAの一部について提示された記事見出し文SPのうちの一つを選択するだけで済むことから、作業者の作業工数の削減が図られる。
 なお、上述したように、制約情報の種別ごとに異なる記事見出し文SPを作成する必要はない。例えば、制約情報がないユーザに提示するために作成した記事見出し文SPが、他の制約情報を有したユーザに対しても適切である場合には、新着記事NAの記事見出し文SPはユーザによらず一つとなる。
 なお、作業者に提示情報を提示する処理においては、作業者が提示情報に基づいて記事見出し文SPを生成する作業を行いやすいように、各種操作子や入力欄が設けられたウェブページ情報が提示されるように構成してもよい。
 具体的には、提示情報(記事見出し文SPの候補や個人キーワードKiや記事内容の趣旨の情報など)が掲載されたウェブページ情報であって、編集を開始するためのボタンや、複数の記事見出し文SPの候補から一つを選択するためのラジオボタンや、個人キーワードKiを用いて記事見出し文SPを作成するための文章入力欄や、最終的に記事見出し文SPを決定するための編集完了ボタン等が設けられたウェブページ情報が作業者に提示される。
 これにより、作業者の作業工数を削減することができる。
 図10及び図11に示した処理と、作業者による記事見出し文SPの作成作業は、例えば、新着記事NAを受信してからユーザに記事を提示するまでに実行される。具体的には、ユーザ端末4から新着記事NAの記事見出し文SPが掲載されたウェブページの要求を受信する前に行われる。これによって、ユーザ端末4からウェブページ要求を受信した場合に、ユーザの制約情報に応じて既に用意されているいくつかの記事見出し文SPから一つを選択するだけで、ユーザ毎に適したウェブページが提供される。
[4-4.ウェブページ情報要求受信処理]
 ユーザ端末4からウェブページ情報要求を受信した際にサイト管理端末1が実行する処理について、図13を参照して説明する。特に、ニュース掲載サイトにおける記事見出し文SPが掲載されたウェブページ情報の要求を受信した場合の例について説明する。
 なお、この処理は、例えば、サイト管理端末1が記事管理部1aやウェブページ生成部1j、或いは、要求受信部1kや送信部1mの各機能を用いることにより実行される。
 記事見出し文SPが掲載されたウェブページ情報の要求を受信したサイト管理端末1はステップS501で、ユーザ情報を取得する処理を行う。ここで取得するユーザ情報は、制約情報を含む。他にも、ユーザに適した広告情報を取得するためにユーザの閲覧履歴や購買履歴、或いは趣味嗜好の情報を取得してもよい。
 サイト管理端末1はステップS502で、記事情報(記事IDや記事本文)と共に記事見出し文SPの情報を一つ取得する。
 サイト管理端末1はステップS503で、記事見出し文SPに用いられる注目キーワードKnに関して、置換キーワードKrを使用するか否かを判定する。この判定は、ユーザの制約情報と記事見出し文SPに含まれる注目キーワードKnに基づいて行われる。
 具体的には、ユーザ情報に制約情報がない場合には置換キーワードKrを使用しないとし、制約情報がある場合には置換キーワードKrを使用すると判定する。但し、制約情報を有したユーザであっても、注目キーワードKnを用いても問題がない場合には置換キーワードKrを使用しないと判定する。
 例えば、「低語学力」とされたユーザについては注目キーワードKnの代わりに置換キーワードKrを用いるが、「全盲」や「弱視」とされたユーザについては注目キーワードKnをそのまま用いる場合などである。
 サイト管理端末1はステップS504で、判定結果に応じた分岐処理を行う。置換キーワードKrを使用しない場合は、サイト管理端末1はステップS505で置換キーワードKrを用いずに注目キーワードKnをそのまま用いて作成された記事見出し文を選択する。この記事見出し文SPは、制約情報がないユーザ用に作成されたものであるが、前述のように、制約情報を有するユーザであっても注目キーワードKnをそのまま用いて問題がないユーザについても用いられる。
 一方、置換キーワードKrを使用する場合は、サイト管理端末1はステップS506で置換キーワードKrを用いて作成された記事見出し文SPを選択する。このとき、ユーザの制約情報の種別に応じて適切な記事見出し文SPを選択する。
 サイト管理端末1はステップS507で、未処理の記事見出し文SPの有無によって分岐する。
 記事見出し文SPは、同じウェブページ上に複数設けられることが考えられる。例えば、10件分の新着記事NAの記事見出し文SPが掲載されるウェブページなどである。
 そのような場合には、掲載される記事見出し文SPの数だけステップS502乃至ステップS506の各処理を行う必要がある。
 ステップS507の分岐処理は、そのために実行されるものである。
 未処理の記事見出し文SPがある場合、サイト管理端末1はステップS502の処理を再度実行する。
 一方、未処理の記事見出し文SPがない場合、即ち、全ての記事見出し文SPについての処理を完了した場合、サイト管理端末1はステップS508でウェブページ生成処理を実行する。この処理では、これまでに選択した各記事見出し文SPをウェブページ上の所定位置に配置したウェブページ情報(HTMLなど)を生成する。
 最後に、サイト管理端末1はステップS509で、ウェブページ情報の提示処理を行う。この処理に応じて、ウェブページ情報要求を行ったユーザ端末4の表示部(モニタ等)に記事見出し文SPが掲載されたウェブページが表示される。
<5.変形例>

[5-1.変形例1]
 変形例1では、サイト管理端末1が記事見出し文SPの候補を作成すると共に、作成した記事見出し文SPが過去に掲載された記事見出し文SPと似ていないかを判定する処理を実行する。
 記事の内容が異なるにも関わらず、記事見出し文SPが同じ(若しくは似ている)場合、ユーザは既に読んだことのある記事と誤認してしまい、新たな情報を得るための機会を損失してしまう虞がある。
 そのために、新着記事NAの記事見出し文SPと過去に掲載済みの記事見出し文SPの類似判定を行うものである。
 具体的に図14を参照して説明する。なお、図14に示す各処理のうち、図10を参照して説明した処理については、適宜説明を省略する。
 サイト管理端末1は、ステップS301乃至S306を実行することにより、新着記事NAの記事内容に基づいた分類を行うと共に、分類された記事クラスタACに設定された注目キーワードの中から新着記事NAの記事内容に沿った注目キーワードKnを特定する。そして、該特定した注目キーワードKnに基づいて個人キーワードKiを設定する。個人キーワードKiは、前述のように、ユーザの制約情報の種別ごとに設定され得る。
 個人キーワード設定処理を終えたサイト管理端末1は、ステップS320で、個人キーワードKiごとの記事見出し文を生成する。この処理では、個人キーワードKiを用いると共に、ステップS301で実行した記事内容解析処理によって取得した記事の主体(主語となり得るもの)や述語となり得る動詞などの語句を用いて記事見出し文SPを生成する。
 サイト管理端末1はステップS321で、類似判定処理を行う。類似判定処理では、例えば、直近の所定期間(例えば1日や3日、或いは1週間や1ヶ月など)にウェブページに掲載された記事見出し文SPと、今回生成した新着記事NAの記事見出し文SPの比較を行い、似ているか否か(類似度の高低)を判定する。
 サイト管理端末1はステップS322で、類似判定処理の処理結果に応じた分岐を行う。即ち、似ている(類似度が高い)と判定した場合は、サイト管理端末1はステップS320で再度記事見出し文の生成を行う。
 一方、似ていない(類似度が低い)と判定した場合は、サイト管理端末1はステップS307へと進み記事見出し文SPを作業者に提示する処理を行う。
 提示処理によって新着記事NAの記事見出し文SPの候補を提示された作業者は、例えば文章の微調整を行うのみで記事見出し文SPを完成させることができるため、作業工数の削減が図られる。特に、直近の所定期間に同じような記事見出し文SPを作成していないか確認する手間を削減できる。
 なお、新着記事NAが他の記事の続報であるような一連の記事群に属している場合には、該一連の記事群の記事見出し文SPとの類似判定を行わなくてもよい。即ち、ステップS321の類似判定処理においては、一連の記事群以外の他の記事についての記事見出し文SPとの類似を判定すればよい。
 なお、ステップS320乃至ステップS322の処理を何度か行ったにも関わらず、生成した記事見出し文SPが直近の所定期間の間に提示された記事見出し文SPと類似してしまった場合には、ステップS307で個人キーワードKiと記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示する処理に切り換えてもよい。その場合には、記事見出し文SPを作成する作業者が提示情報を用いて記事作成を行う。この場合であっても、作業者は個人キーワードKiや記事内容の趣旨の情報が提示されるため、記事見出し文SPの作成工数の削減を図ることができる。
[5-2.変形例2]
 ウェブページの特定の場所に掲載される記事見出し文SPには、文字数制限が設けられている場合がある。そのような場合にサイト管理端末1が行う処理について、図15を参照して説明する。
 なお、図15に示すステップS301乃至ステップS305の各処理については、既述のため説明を省略する。
 ユーザの制約情報の種別ごとに個人キーワードKiを設定した後、サイト管理端末1はステップS340で個人キーワードKiごとの記事見出し文SPを生成する処理を行う。この処理についても既述のため説明を省略する。
 続いて、サイト管理端末1はステップS341で、新着記事NAの記事見出し文SPの文字数が所定文字数よりも大きいか否かを判定する。所定文字数よりも大きい場合には、サイト管理端末1はステップS340の記事見出し文生成処理を再度実行する。
 一方、新着記事NAの記事見出し文SPの文字数が所定文字数以下である場合、サイト管理端末1はステップS307の処理へと進む。
 ステップS341の判定処理は、ステップS340で生成した記事見出し文SPの数だけ実行される。これによって、所定文字数以下の記事見出し文SPが少なくとも一つは生成され、記事見出し文SPの作成作業の効率化が図られる。
 なお、ステップS340及びステップS341の処理を何度か行ったにも関わらず、所定文字数以下の記事見出し文SPが生成できなかった場合には、ステップS307で個人キーワードKiと記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示する処理に切り換えてもよい。その場合には、記事見出し文SPを作成する作業者が提示情報を用いて記事作成を行う。この場合であっても、作業者は個人キーワードKiや記事内容の趣旨の情報が提示されるため、記事見出し文SPの作成工数の削減を図ることができる。
 なお、ユーザが全盲ユーザであり、音声出力によって記事見出し文SPをユーザに伝達する場合には、文字数制限の閾値である所定文字数を緩和することが考えられる。所定文字数は、ウェブページに配置される各コンテンツの所定の配置態様を守るための制限である。即ち、所定文字数よりも多い記事見出し文SPがウェブページに掲載されてしまうと、ウェブページ情報のレイアウトが崩れてしまい、掲載された各種の情報が見にくくなってしまう虞がある。そのために所定文字数の制限が設けられるものである。
 しかし、ウェブページのレイアウトを認識できないユーザに対して音声出力で記事見出し文SPを伝達することを考えると、レイアウトの崩壊は考慮しなくていい場合が考えられる。そのような場合には、例えば所定文字数が15文字であるところを20文字や倍の30文字に緩和してもよい。但し、過度に長すぎる文章(例えば100文字の文章)を記事見出し文SPとして音声出力してしまうと、複数の記事見出し文SPの情報をユーザが獲得するために要する時間が長くなってしまうため、これも好ましくない。
[5-3.変形例3]
 上述した各例では、サイト管理端末1が記事見出し文SPの候補を生成して提示するケースと、記事見出し文SPを作成するための個人キーワードKiを提示するケースの二つのパターンを説明した。
 ここでは、その双方を組み合わせた場合について説明する。
 例えば、日中の時間帯においては、サイト管理端末1は個人キーワードKiと記事内容の趣旨の情報を提示情報として作業者に提示する構成とし、記事見出し文SPは作業者が作成するようにする。そして、夜間の時間帯においては、サイト管理端末1は記事見出し文SPの候補を生成して提示情報として作業者に提示する構成とし、作業者はその中から選択するだけで済むようにする。
 これにより、日中の時間帯は、作業者の工数を多少消費して、記事見出し文SPの作成を行うと共に、夜間の時間帯は、作業者の工数を極力削減して、記事見出し文SPの作成を行うことができる。
 また、日中の時間帯に作業者の工数を消費して作成した記事見出し文SPに基づいてサイト管理端末1が機械学習を行うことにより、注目キーワードKnの設定や個人キーワードKiの設定に作業者の方針を反映させることができる。
 なお、一部の記事見出し文SPの作成においては、サイト管理端末1が提示情報の作成を行わず、完全な手動による記事見出し文SPの作成を行ってもよい。このようにして手動で作成された記事見出し文SPに基づいて機械学習を行うことにより、作業者の記事見出し文SPの方針をより反映させることが可能となる。
<6.まとめ>

 上記の各例で説明したように、サイト管理端末1としての情報処理装置は、配信記事を受信し新着記事NAとして管理する記事管理部1aと、新着記事NAを記事クラスタACに分類する分類処理部1cと、記事クラスタACに属する閲覧数の多い人気記事の記事見出し文SPから取得したキーワードに基づいて人気記事が属する記事クラスタACの注目キーワードKnを管理する注目キーワード管理部1dと、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部1bと、新着記事NAの記事クラスタACと新着記事NAの記事内容と制約情報と注目キーワードKnに基づいてユーザごとに適切な個人キーワードKiを決定するキーワード決定部1eと、個人キーワードKiを用いて新着記事NAの記事見出し文SP生成のための提示情報を生成する提示情報生成部1gと、を備えている。
 記事内容に即した記事見出し文SPを手動で作成することは、非常に大きな工数が必要となる。本構成によれば、記事クラスタACごとに注目キーワードKnが管理されると共に、注目キーワードKnを用いて記事内容に即した提示情報が生成される。提示情報としては、例えば、記事見出し文SPに使えそうなキーワードの候補や、記事見出し文SPの候補などである。
 これによって、記事見出し文SPの作成に要する工数の大幅な削減を図ることができる。特に、記事クラスタACごとの注目キーワードKnを用いることで、ユーザに興味を持たせることが可能なクリック誘因性の高い記事見出し文を作成するための提示情報を生成することができる。
 図10を参照して説明したように、キーワード決定部1eは、注目キーワードKnから記事クラスタACに応じた第1キーワード(記事クラスタACに設定された注目キーワードKn)を選択する第1選択処理(ステップ303)と、第1キーワードから新着記事ACの記事内容に応じて第2キーワード(記事内容にそぐわない注目キーワードKnを排除したもの)を選択する第2選択処理(ステップS304)と、第2キーワードから制約情報に応じて個人キーワードKiを選択する第3選択処理(ステップS305)と、を行うものである。
 即ち、新着記事NAに応じた適切な記事クラスタACの注目キーワードKnを第1キーワードとして選択し、その中から、新着記事NAの記事内容に応じた適切なキーワードを第2キーワードとして選択し、更にその中から、記事を閲覧するユーザごとの制約情報に応じて適切なキーワードを個人キーワードKiとして選択し決定する。従って、決定された個人キーワードKiは、新着記事NAの記事クラスタACに適切であり、且つ記事内容に沿ったものであり、更に、ユーザの制約情報を加味したものとなる。
 以上のような具体的な処理を実行することにより、ユーザの状況・環境に応じた適切な記事見出し文SPを提供することができる。
 変形例3で説明したように、キーワード決定部1eは、新着記事NAにおける一部の記事について個人キーワードKiの決定を行い、提示情報生成部1gは、一部の記事についての提示情報を生成してもよい。
 即ち、新着記事NA全てについて提示情報が生成されるのではなく、一部の新着記事NAについて提示情報が生成される。
 即ち、他の一部の新着記事NAについては、作業者による手動の記事見出し文作成が行われる。情報処理装置(サイト管理端末1)は、この手動の記事見出し文SPを学習することにより、記事見出し文SPに使われやすい注目キーワードKnを継続的にアップデートすることができる。従って、最近話題のキーワードや流行のキーワードが注目キーワードKnとして加えられ、自動で記事見出し文生成のための提示情報を生成する場合に、人の目を引きやすいクリック誘因性の高い提示情報を生成することができる。
 新着記事受信処理で説明したように、記事見出し文SPを生成するための操作が可能な状態で提示情報を提示する提示部1iを備えていてもよい。
 例えば、いくつかの記事見出し文SPの候補が掲載されると共に、候補から一つを選択することができるインタフェースを備えたウェブページが作業者に提示される。また、選択した一つの記事見出し文候補を編集できるようなインタフェースも設けられ、作業者は簡易的な操作で、記事見出し文SPを完成させることができる。
 従って、記事見出し文SPの作成に係る作業工数の削減に寄与することができる。
 また、記事見出し文SPを生成するためのパーツとして、新着記事NAに適したいくつかの注目キーワードKnが掲載されたウェブページであって、それらのキーワードを元に記事見出し文SPを作成できるような編集が可能なインタフェースが設けられたウェブページが作業者に提示されてもよい。
 変形例2などで説明したように、提示情報生成部1gは、提示情報として所定以内の文字数で構成された記事見出し文SPを生成してもよい。
 これにより、記事見出し文SPを決定する作業者は、自動で生成された記事見出し文SPの候補から一つを選択するだけでよい。
 従って、作業効率の著しい向上が図られる。
 また、記事見出し文SPの候補が一つである場合には、一つを選択する作業すら不要となり、更なる作業効率の改善が図られる。
 なお、上述したように、記事見出し文SPの候補から選択した一つの記事見出し文SPの編集が可能とされていてもよい。これによって、作業効率の向上と適切な記事見出し文SPの生成の両立が図られる。
 変形例1などで説明したように、直近の所定期間内に掲載された記事見出し文SPと提示情報生成部1gが生成した記事見出し文SPとの類似を判定する類似判定部1hを備え、提示情報生成部1gは、類似判定部1hが類似と判定した場合に、提示情報としての記事見出し文SPを再生成するように構成してもよい。
 類似判定部1hが設けられることにより、記事見出し文SP同士の類似/非類似が判定可能とされる。
 即ち、異なる記事で既に使われた記事見出し文SPと似たような記事見出し文SPが生成されてしまうことを防止することができる。これにより、記事が既に見た事がある記事であると誤認されてしまい記事が閲覧されない虞を排除し、記事の閲覧可能性を高めることができる。
 ユーザDB51の説明において触れたように、制約情報は、ユーザの言語能力に関する情報とされていてもよい。
 例えば日本語の能力が高い人と低い人について、同じ記事見出し文SPを用いてしまうと、記事見出し文SPを目にしたユーザが推定した記事内容に相違が出てしまう場合や、そもそも記事内容の推定ができない場合が生じる。この構成によれば、そういった事態に対応するために、言語能力の高低(即ち低語学力ユーザであるか否か)に応じた注目キーワードKnが個人キーワードKiとして決定される。
 従って、言語能力に応じた記事見出し文SPを生成することが可能となる。
 ユーザDB51の説明において触れたように、制約情報は、ユーザの視覚障害に関する情報とされていてもよい。
 例えば、全盲である視覚障害者は、記事見出し文SPや記事本文の情報を音声で取得することが考えられる。そのような状況で相応しくない注目キーワードKnとして、例えば同音異義語がある。本構成によれば、同音異義語のような適していない語句を避け、他の語句を用いて提示情報が生成される。
 従って、視覚障害者にとっても利便性の高い記事見出し文SP生成のための環境を提供することができる。また、様々な人々に利用可能とされることで、公益性の高いシステムを提供することができる。
 新着記事受信処理で説明したように、制約情報に基づいて、注目キーワードKnの置換処理(ステップS407及びステップS408の処理)を行う置換処理部1fを備え、キーワード決定部1eは、置換処理によって得られたキーワードを個人キーワードKiとして決定してもよい。
 注目キーワードKnが一部のユーザにとって適切でない場合、そのユーザに対しては他の注目キーワードKnが個人キーワードKiとして決定されてもよいが、本構成によれば、それ以外の手段を用いて当該ユーザに適切な記事見出し文生成のための提示情報が生成される。
 即ち、選択された注目キーワードKn(個人キーワード)と同じ意味を持つ他の代替キーワード(置換キーワードKr)が個人キーワードKiとして設定され、該個人キーワードKiを用いて提示情報生成が行われる。従って、当該一部のユーザにとっても最適な記事見出し文Spの生成を行うことができる。
 ウェブページ情報要求受信処理(図13)の例で説明したように、端末装置(ユーザ端末4)からのウェブページ要求を受信する要求受信部1kと、記事が属する記事クラスタACと、記事の記事内容と、端末装置(ユーザ端末4)を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文SPを取得し、ユーザごとの記事見出し文SPが掲載されるウェブページの情報を生成するウェブページ生成部1jと、生成されたウェブページの情報を端末装置(ユーザ端末4)に送信する送信部1mと、を備えていてもよい。
 ユーザが記事見出し文SPが掲載されたウェブページを閲覧した場合に、ユーザの制約情報(例えば、低語学ユーザであるか否かの情報や視覚障害を有したユーザであるか否かを示す情報)に基づいて設定されたユーザに特化した記事見出し文SPがユーザに提示される。これによって、ユーザは、自身の制約情報に基づいて設定された適切な記事見出し文SPを閲覧(或いは視聴、聴取も含むが、ここではそれらを含めて「閲覧」と記載する)することができるため、記事見出し文SPを適切に理解することができると共に、記事本文の内容を適切に予測することが可能となる。即ち、誤った予測によって閲覧したくない記事詳細の情報を閲覧してしまう可能性を低減させることができる。これによって、ユーザが無為に時間を浪費してしまうことを防止し、効率のよい情報収集が可能となる。
 上記した各種の構成及び処理は、それぞれ適宜組み合わせることが可能である。
<7.プログラム及び記憶媒体>

 実施の形態のプログラムは、サイト管理端末1の演算処理装置(CPU等)に各種の処理を実行させるプログラムである。
 実施の形態のプログラムは、配信記事を受信し新着記事として管理する記事管理機能を演算処理装置に実行させる。
 また、新着記事を記事クラスタに分類する分類処理機能を演算処理装置に実行させる。
 更に、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能を演算処理装置に実行させる。
 更にまた、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能を演算処理装置に実行させる。
 加えて、新着記事の記事クラスタと新着記事の記事内容と制約情報と注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能を演算処理装置に実行させる。
 そして、個人キーワードを用いて新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能を演算処理装置に実行させる。
 即ちこのプログラムは、情報処理装置の演算処理装置に対して図8乃至図11、図13乃至図15の各図に示す処理を実行させるプログラムである。
 また、実施温形態のプログラムは、端末装置からのウェブページ要求を受信する要求受信機能を演算処理装置に実行させる。
 更に、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能を演算処理装置に実行させる。
 そして、前記生成されたウェブページの情報を前記端末装置に送信する送信機能を演算処理装置に実行させる。
 即ちこのプログラムは、情報処理装置の演算処理装置に対して図13に示す処理を実行させるプログラムである。
 このようなプログラムにより、上述したサイト管理端末1としての1または複数の情報処理装置を実現できる。
 そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
 また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
 1 サイト管理端末、1a 記事管理部、1b ユーザ情報管理部、1c 分類処理部、1d 注目キーワード管理部、1e キーワード決定部、1f 置換処理部、1g 提示情報生成部、1h 類似判定部、1i 提示部、1j ウェブページ生成部、2 通信ネットワーク、3 配信社端末、4 ユーザ端末、50 記事DB、51 ユーザDB、52 クラスタDB、53 キーワードDB、54 置換ワードDB

Claims (16)

  1.  配信記事を受信し新着記事として管理する記事管理部と、
     前記新着記事を記事クラスタに分類する分類処理部と、
     記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、
     ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、
     前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、
     前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えた
     情報処理装置。
  2.  前記キーワード決定部は、
     前記注目キーワードから前記記事クラスタに応じた第1キーワードを選択する第1選択処理と、前記第1キーワードから前記新着記事の記事内容に応じて第2キーワードを選択する第2選択処理と、前記第2キーワードから前記制約情報に応じて前記個人キーワードを選択する第3選択処理と、を行う
     請求項1に記載の情報処理装置。
  3.  前記キーワード決定部は、前記新着記事における一部の記事について前記個人キーワードの決定を行い、
     前記提示情報生成部は、前記一部の記事についての提示情報を生成する
     請求項1に記載の情報処理装置。
  4.  記事見出し文を生成するための操作が可能な状態で前記提示情報を提示する提示部を備えた
     請求項1に記載の情報処理装置。
  5.  前記提示情報生成部は、前記提示情報として所定以内の文字数で構成された記事見出し文を生成する
     請求項1に記載の情報処理装置。
  6.  直近の所定期間内に掲載された記事見出し文と前記提示情報生成部が生成した記事見出し文との類似を判定する類似判定部を備え、
     前記提示情報生成部は、前記類似判定部が類似と判定した場合に、前記提示情報としての記事見出し文を再生成する
     請求項5に記載の情報処理装置。
  7.  前記制約情報は、ユーザの言語能力に関する情報とされた
     請求項1に記載の情報処理装置。
  8.  前記制約情報は、ユーザの視覚障害に関する情報とされた
     請求項1に記載の情報処理装置。
  9.  前記制約情報に基づいて、前記注目キーワードの置換処理を行う置換処理部を備え、
     前記キーワード決定部は、前記置換処理によって得られたキーワードを前記個人キーワードとして決定する
     請求項1に記載の情報処理装置。
  10.  配信記事を受信し新着記事として管理する記事管理ステップと、
     前記新着記事を記事クラスタに分類する分類処理ステップと、
     記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理ステップと、
     ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理ステップと、
     前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定ステップと、
     前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成ステップと、を
     情報処理装置が実行する情報処理方法。
  11.  配信記事を受信し新着記事として管理する記事管理機能と、
     前記新着記事を記事クラスタに分類する分類処理機能と、
     記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能と、
     ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能と、
     前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能と、
     前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能と、を
     コンピュータに実行させるプログラム。
  12.  配信記事を受信し新着記事として管理する記事管理機能と、
     前記新着記事を記事クラスタに分類する分類処理機能と、
     記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能と、
     ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能と、
     前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能と、
     前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能と、を
     コンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
  13.  端末装置からのウェブページ要求を受信する要求受信部と、
     記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成部と、
     前記生成されたウェブページの情報を前記端末装置に送信する送信部と、を備えた
     情報処理装置。
  14.  端末装置からのウェブページ要求を受信する要求受信ステップと、
     記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成ステップと、
     前記生成されたウェブページの情報を前記端末装置に送信する送信ステップと、を
     情報処理装置が実行する情報処理方法。
  15.  端末装置からのウェブページ要求を受信する要求受信機能と、
     記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能と、
     前記生成されたウェブページの情報を前記端末装置に送信する送信機能と、を
     コンピュータに実行させるプログラム。
  16.  端末装置からのウェブページ要求を受信する要求受信機能と、
     記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能と、
     前記生成されたウェブページの情報を前記端末装置に送信する送信機能と、を
     コンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
PCT/JP2018/026306 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体 WO2020012595A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2018/026306 WO2020012595A1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体
JP2019506537A JP6533354B1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/026306 WO2020012595A1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体

Publications (1)

Publication Number Publication Date
WO2020012595A1 true WO2020012595A1 (ja) 2020-01-16

Family

ID=66934350

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/026306 WO2020012595A1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体

Country Status (2)

Country Link
JP (1) JP6533354B1 (ja)
WO (1) WO2020012595A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417149A (zh) * 2020-11-11 2021-02-26 北京工业大学 一种基于多任务学习的标题生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109743A (ja) * 1999-08-26 2001-04-20 Internatl Business Mach Corp <Ibm> フォーマット駆動の構文的文書トランスコーディング・フレームワークに意味的特性を組み込むためのシステムおよび方法
JP2006031476A (ja) * 2004-07-16 2006-02-02 Sony Corp 電子機器装置、サーバ装置、Webページ処理方法及びそのプログラム
JP2008234338A (ja) * 2007-03-20 2008-10-02 Nec Corp 旬度解析システム、旬度解析方法、及び旬度解析プログラム
JP2018013876A (ja) * 2016-07-19 2018-01-25 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109743A (ja) * 1999-08-26 2001-04-20 Internatl Business Mach Corp <Ibm> フォーマット駆動の構文的文書トランスコーディング・フレームワークに意味的特性を組み込むためのシステムおよび方法
JP2006031476A (ja) * 2004-07-16 2006-02-02 Sony Corp 電子機器装置、サーバ装置、Webページ処理方法及びそのプログラム
JP2008234338A (ja) * 2007-03-20 2008-10-02 Nec Corp 旬度解析システム、旬度解析方法、及び旬度解析プログラム
JP2018013876A (ja) * 2016-07-19 2018-01-25 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417149A (zh) * 2020-11-11 2021-02-26 北京工业大学 一种基于多任务学习的标题生成方法
CN112417149B (zh) * 2020-11-11 2024-03-19 北京工业大学 一种基于多任务学习的标题生成方法

Also Published As

Publication number Publication date
JP6533354B1 (ja) 2019-06-19
JPWO2020012595A1 (ja) 2020-07-16

Similar Documents

Publication Publication Date Title
US8290924B2 (en) Providing answer to keyword based query from natural owner of information
JP4959205B2 (ja) 別々のデータ情報源にまたがる選択済みコンテンツの生の要約の作成を容易にするシステム及び方法
CN101404022B (zh) 在多个客户机系统之间共享可动作的标签的方法
US7664680B2 (en) Method and apparatus for creating contextual auction feeds
US20090077056A1 (en) Customization of search results
US10896620B2 (en) Programmable interface for automated learning refreshers
US10402479B2 (en) Method, server, browser, and system for recommending text information
US9129009B2 (en) Related links
CN111279328A (zh) 预测对于特定场境的搜索的意图
JP2013235507A (ja) 情報処理方法、装置、コンピュータプログラムならびに記録媒体
US20150154295A1 (en) Searching method, system and storage medium
CN112230838A (zh) 一种文章处理方法、装置、设备及计算机可读存储介质
US11392589B2 (en) Multi-vertical entity-based search system
CN115210692A (zh) 用于数字动作执行的接口和模式选择
JP6457058B1 (ja) 知的財産システム、知的財産支援方法および知的財産支援プログラム
WO2021243985A1 (zh) 天气预报视频的生成方法、装置、电子设备及存储介质
WO2020012595A1 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
WO2022249676A1 (ja) プログラム、方法、情報処理装置
KR102263317B1 (ko) 속성 언어 관리 방법 및 장치
KR102279125B1 (ko) 취향필터에 기반한 추천 정보 제공 단말 및 장치
CN107123318B (zh) 一种基于输入法装置的外文写作学习系统
US20190042652A1 (en) Systems and methods for improving search results through partial selection of an initial result
KR102340404B1 (ko) 언어 단위를 이용한 영화 추천 항목 관리 방법 및 장치
JP6628848B1 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
JP2009080334A (ja) 言語学習支援方法、言語学習支援装置およびプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019506537

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18925958

Country of ref document: EP

Kind code of ref document: A1