JP2023104183A - Program and information processing method - Google Patents

Program and information processing method Download PDF

Info

Publication number
JP2023104183A
JP2023104183A JP2022005031A JP2022005031A JP2023104183A JP 2023104183 A JP2023104183 A JP 2023104183A JP 2022005031 A JP2022005031 A JP 2022005031A JP 2022005031 A JP2022005031 A JP 2022005031A JP 2023104183 A JP2023104183 A JP 2023104183A
Authority
JP
Japan
Prior art keywords
file
search
processor
files
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022005031A
Other languages
Japanese (ja)
Inventor
恭大 福世
Yasuhiro Fukuse
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2022005031A priority Critical patent/JP2023104183A/en
Publication of JP2023104183A publication Critical patent/JP2023104183A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a program and an information processing method capable of presenting a summary sentence of a retrieved file.SOLUTION: A program executed by a processor allows the processor to implement a function of generating a summary sentence of a text included in a retrieval object file; the function of acquiring retrieval information for retrieving the file; the function of retrieving the file from the retrieval object file, on the basis of the retrieval information; and the function of outputting identification information for identifying the retrieved file and the summary sentence of the text included in the retrieved file.SELECTED DRAWING: Figure 1

Description

本発明の実施形態は、プログラム及び情報処理方法に関する。 The embodiment of the present invention relates to a program and an information processing method.

検索ワードなどに基づいてテキストを含むファイルを検索するシステムが提供されている。そのようなシステムは、検索されたファイルの一覧をユーザに提示する。 Systems are provided that search for files containing text based on search words or the like. Such systems present the user with a list of retrieved files.

ユーザは、検索されたファイルの一覧から有益なファイルを探すためにファイルの中身を1件ずつ確認する。そのため、ユーザは、有益なファイルを探すために時間が掛かる。 The user checks the contents of the files one by one in order to search for useful files from the list of searched files. Therefore, the user spends a lot of time searching for useful files.

特開平10-207891号公報JP-A-10-207891

上記の課題を解決するため、検索されたファイルの要約文を提示することができるプログラム及び情報処理方法を提供する。 In order to solve the above problems, a program and an information processing method capable of presenting a summary of a searched file are provided.

実施形態によれば、プロセッサによって実行されるプログラムは、前記プロセッサに、検索対象ファイルに含まれるテキストの要約文を生成する機能と、ファイルを検索するための検索情報を取得する機能と、前記検索情報に基づいて、前記検索対象ファイルからファイルを検索する機能と、検索された前記ファイルを識別する識別情報と検索された前記ファイルに含まれるテキストの要約文とを出力する機能と、を実現させる。 According to the embodiment, the program executed by the processor provides the processor with a function of generating a summary of text contained in a search target file, a function of obtaining search information for searching the file, and a function of obtaining search information for searching the file; Based on the information, a function of retrieving a file from the files to be searched and a function of outputting identification information for identifying the retrieved file and a summary of the text included in the retrieved file are realized. .

図1は、実施形態に係る検索システムの構成例を示すブロック図である。FIG. 1 is a block diagram showing a configuration example of a search system according to an embodiment. 図2は、実施形態に係るサーバの構成例を示すブロック図である。FIG. 2 is a block diagram illustrating a configuration example of a server according to the embodiment; 図3は、実施形態に係るユーザ端末の表示例を示す図である。FIG. 3 is a diagram illustrating a display example of a user terminal according to the embodiment; 図4は、実施形態に係る検索システムの動作例を示すフローチャートである。FIG. 4 is a flow chart showing an operation example of the search system according to the embodiment. 図5は、実施形態に係る検索システムの動作例を示すフローチャートである。FIG. 5 is a flow chart showing an operation example of the search system according to the embodiment.

以下、実施形態について、図面を参照して説明する。
実施形態に係る検索システムは、ファイルを検索するための情報(検索ワードなど)をユーザから入力する。検索システムは、当該情報に基づいてファイルを検索する。検索システムは、検索されたファイルの一覧をユーザに提示する。
Hereinafter, embodiments will be described with reference to the drawings.
A search system according to an embodiment inputs information (search words, etc.) for searching files from a user. The search system searches for files based on the information. The search system presents the user with a list of searched files.

図1は、実施形態に係る検索システム1の構成例を示すブロック図である。図1が示すように、検索システム1は、サーバ10及びユーザ端末20などを備える。サーバ10とユーザ端末20とは、ネットワークなどを介して互いに接続する。 FIG. 1 is a block diagram showing a configuration example of a search system 1 according to an embodiment. As shown in FIG. 1, the search system 1 includes a server 10, user terminals 20, and the like. The server 10 and the user terminal 20 are connected to each other via a network or the like.

サーバ10は、テキストを含むファイルを予め保持する。サーバ10は、ファイルを検索するための情報(検索情報)をユーザ端末20から取得する。サーバ10は、検索情報に従って検索されたファイルと要約文とをユーザ端末20に表示させる。サーバ10については、後に詳述する。 The server 10 pre-stores files containing text. The server 10 acquires information (search information) for searching for files from the user terminal 20 . The server 10 causes the user terminal 20 to display the file and the summary sentence searched according to the search information. The server 10 will be detailed later.

ユーザ端末20(外部装置)は、ファイルを検索するユーザが使用する端末である。ユーザ端末20は、キーボードなどの操作部とモニタなどの表示部とから構成される。ユーザ端末20は、操作部を通じてユーザから検索情報を入力する。検索情報を入力すると、ユーザ端末20は、入力された検索情報を含むリクエストをサーバ10に送信する。 The user terminal 20 (external device) is a terminal used by a user who searches for files. The user terminal 20 includes an operation unit such as a keyboard and a display unit such as a monitor. The user terminal 20 inputs search information from the user through the operation unit. After inputting search information, the user terminal 20 transmits a request including the input search information to the server 10 .

ユーザ端末20は、検索されたファイルと要約文とを表示させるレスポンスをサーバ10から受信する。レスポンスを受信すると、ユーザ端末20は、レスポンスに従って、検索されたファイルと要約文とを表示部に表示する。 The user terminal 20 receives a response from the server 10 to display the searched file and the abstract. Upon receiving the response, the user terminal 20 displays the searched file and the abstract on the display unit according to the response.

たとえば、ユーザ端末20は、デスクトップPC、ノートPC、タブレットPC、スマートフォン又はウェアラブル端末などである。
なお、検索システム1は、複数のユーザ端末20を備えるものであってもよい。
For example, the user terminal 20 is a desktop PC, notebook PC, tablet PC, smart phone, wearable terminal, or the like.
Note that the search system 1 may be provided with a plurality of user terminals 20 .

次に、サーバ10について説明する。
図2は、実施形態に係るサーバ10の構成例を示す。図2が示すように、サーバ10は、プロセッサ11、ROM12、RAM13、NVM14、通信部15、操作部16及び表示部17などを備える。
Next, the server 10 will be explained.
FIG. 2 shows a configuration example of the server 10 according to the embodiment. As shown in FIG. 2, the server 10 includes a processor 11, a ROM 12, a RAM 13, an NVM 14, a communication section 15, an operation section 16, a display section 17, and the like.

プロセッサ11と、ROM12、RAM13、NVM14、通信部15、操作部16及び表示部17と、は、データバス又はインターフェースなどを介して互いに接続する。
なお、サーバ10は、図2が示すような構成の他に必要に応じた構成を具備したり、サーバ10から特定の構成が除外されたりしてもよい。
The processor 11, ROM 12, RAM 13, NVM 14, communication unit 15, operation unit 16, and display unit 17 are connected to each other via a data bus, an interface, or the like.
It should be noted that the server 10 may have a configuration other than the configuration shown in FIG. 2 as necessary, or a specific configuration may be excluded from the server 10 .

プロセッサ11は、サーバ10全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。 The processor 11 has a function of controlling the operation of the server 10 as a whole. Processor 11 may include an internal cache, various interfaces, and the like. The processor 11 implements various processes by executing programs pre-stored in the internal memory, ROM 12 or NVM 14 .

なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。 Note that some of the various functions realized by the processor 11 executing the program may be realized by hardware circuits. In this case, processor 11 controls the functions performed by the hardware circuits.

ROM12は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラム及び制御データは、サーバ10の仕様に応じて予め組み込まれる。 The ROM 12 is a nonvolatile memory in which control programs, control data, and the like are stored in advance. The control programs and control data stored in the ROM 12 are installed in advance according to the specifications of the server 10 .

RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。 RAM 13 is a volatile memory. The RAM 13 temporarily stores data being processed by the processor 11 . RAM 13 stores various application programs based on instructions from processor 11 . Also, the RAM 13 may store data necessary for executing the application program, execution results of the application program, and the like.

NVM14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。NVM14は、たとえば、HDD(Hard Disk Drive)、SSD(Solid State Drive)又はフラッシュメモリなどから構成される。NVM14は、サーバ10の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。 The NVM 14 is a non-volatile memory in which data can be written and rewritten. The NVM 14 is composed of, for example, an HDD (Hard Disk Drive), SSD (Solid State Drive), flash memory, or the like. The NVM 14 stores control programs, applications, various data, etc. according to the operational use of the server 10 .

NVM14は、テキストを含む複数のファイル(検索対象ファイル)を予め格納する。たとえば、検索対象ファイルは、文書作成ソフトによって生成されたファイル(ワードファイルなど)、プレゼンテーション作成ソフトによって生成されたファイル(パワーポイントファイルなど)、印刷ソフトによって生成されたファイル(PDF(Portable Document Format)ファイル)などである。また、検索対象ファイルは、紙資料に対してOCR(Optical Character Recognition)処理を行って生成されたファイルであってもよい。また、検索対象ファイルは、Webスクレイピング技術などによってWebページから得られた情報から構成されるファイルであってもよい。また、検索対象ファイルは、画像又は動画などを含むものであってもよい。
検索対象ファイルの構成は、特定の構成に限定されるものではない。
The NVM 14 stores in advance a plurality of files (search target files) containing text. For example, files to be searched include files generated by word processing software (word files, etc.), files generated by presentation software (PowerPoint files, etc.), files generated by printing software (PDF (Portable Document Format) files ) and so on. Also, the search target file may be a file generated by performing OCR (Optical Character Recognition) processing on paper materials. Also, the search target file may be a file composed of information obtained from a web page by web scraping technology or the like. Also, the files to be searched may include images, moving images, or the like.
The configuration of the files to be searched is not limited to a specific configuration.

たとえば、プロセッサ11は、オペレータからの操作などに従ってNVM14に検索対象ファイルを格納する。また、プロセッサ11は、オペレータからの操作などに従って検索対象ファイルを更新又は削除するものであってもよい。 For example, the processor 11 stores the search target file in the NVM 14 according to an operator's operation or the like. Also, the processor 11 may update or delete the search target file according to an operator's operation or the like.

通信部15は、ユーザ端末20などと通信するためのインターフェースである。たとえば、通信部15は、インターネットなどのネットワークを通じてユーザ端末20に接続する。たとえば、通信部15は、有線又は無線のLAN(Local Area Network)接続をサポートするインターフェースである。 The communication unit 15 is an interface for communicating with the user terminal 20 and the like. For example, the communication unit 15 connects to the user terminal 20 through a network such as the Internet. For example, the communication unit 15 is an interface that supports wired or wireless LAN (Local Area Network) connection.

操作部16は、オペレータから種々の操作の入力を受け付ける。操作部16は、入力された操作を示す信号をプロセッサ11へ送信する。ここでは、操作部16は、タッチパネルから構成される。 The operation unit 16 receives input of various operations from the operator. The operation unit 16 transmits a signal indicating the input operation to the processor 11 . Here, the operation unit 16 is composed of a touch panel.

表示部17は、プロセッサ11からの画像データを表示する。たとえば、表示部17は、液晶モニタから構成される。操作部16がタッチパネルから構成される場合、表示部17は、操作部16としてのタッチパネルと一体的に形成される。 The display unit 17 displays image data from the processor 11 . For example, the display unit 17 is composed of a liquid crystal monitor. When the operation unit 16 is composed of a touch panel, the display unit 17 is formed integrally with the touch panel as the operation unit 16 .

次に、サーバ10が実現する機能について説明する。サーバ10が実現する機能は、プロセッサ11が内部メモリ、ROM12又はNVM14などに格納されるプログラムを実行することで実現される。 Next, functions realized by the server 10 will be described. The functions realized by the server 10 are realized by the processor 11 executing a program stored in the internal memory, the ROM 12, the NVM 14, or the like.

まず、プロセッサ11は、検索対象ファイルに含まれるテキストを形態素解析する機能を有する。 First, the processor 11 has a function of morphologically analyzing the text contained in the search target file.

プロセッサ11は、NVM14から1つのファイルを取得する。1つのファイルを取得すると、プロセッサ11は、取得されたファイルに含まれるテキストを取得する。テキストを取得すると、プロセッサ11は、取得されたテキストを形態素解析する。即ち、プロセッサ11は、テキストを形態素(たとえば、品詞)に分解する。なお、プロセッサ11は、所定の専門用語又は略語などを1つの形態素として認識するように、テキストを形態素に分解してもよい。 Processor 11 acquires one file from NVM 14 . Upon obtaining a file, processor 11 obtains the text contained in the obtained file. Upon obtaining the text, the processor 11 morphologically analyzes the obtained text. That is, the processor 11 decomposes the text into morphemes (for example, parts of speech). Note that the processor 11 may decompose the text into morphemes such that a predetermined technical term or abbreviation is recognized as one morpheme.

テキストを形態素解析すると、プロセッサ11は、テキストを構成する形態素を示す形態素データを生成する。 When the text is morphologically analyzed, the processor 11 generates morpheme data indicating the morphemes that make up the text.

また、プロセッサ11は、形態素データに基づいて、テキストの要約文を生成する機能を有する。 The processor 11 also has a function of generating a text summary based on the morphological data.

たとえば、NVM14は、形態素データを入力すると要約文を出力する生成モデルを予め格納する。たとえば、生成モデルは、要約文を構成する形態素を出力する。 For example, the NVM 14 stores in advance a generative model that outputs a summary when morphological data is input. For example, a generative model outputs morphemes that make up a summary sentence.

生成モデルは、ニューラルネットワークから構成される。生成モデルは、ニューラルネットワークの入力層に形態素データを入力し、ニューラルネットワークの重み付け係数に基づく演算を行い、ニューラルネットワークの出力層から要約文を出力する。 A generative model consists of a neural network. The generative model inputs morphological data to the input layer of the neural network, performs operations based on the weighting coefficients of the neural network, and outputs a summary sentence from the output layer of the neural network.

生成モデルの重み付け係数は、テキストの形態素データと要約文とを教師データとする学習によって得られる。 The weighting coefficients of the generative model are obtained by learning using text morpheme data and summary sentences as teacher data.

たとえば、教師データは、テキストの形態素データとオペレータが当該テキストから生成した要約文(要約文の形態素データ)とから構成される。 For example, the teacher data consists of morpheme data of a text and a summary sentence (morpheme data of the summary sentence) generated from the text by the operator.

生成モデルは、教師データにおけるテキストの形態素データの入力に対して教師データにおける要約文を出力するように学習されたモデルである。 A generative model is a model trained to output a summary sentence in teacher data in response to input of morphological data of text in teacher data.

プロセッサ11は、生成モデルにテキストの形態素データを入力して要約文を生成する。 The processor 11 inputs text morphological data to the generative model to generate a summary sentence.

要約文を生成すると、プロセッサ11は、当該テキストを含む検索対象ファイルを識別する識別情報(ファイル名、識別子など)と当該テキストの要約文とを対応付けた属性情報を生成する。属性情報を生成すると、プロセッサ11は、生成された属性情報をNVM14に格納する。 After generating the abstract, the processor 11 generates attribute information that associates identification information (file name, identifier, etc.) identifying the search target file containing the text with the abstract of the text. After generating the attribute information, processor 11 stores the generated attribute information in NVM 14 .

NVM14が既に属性情報を格納している場合、プロセッサ11は、識別情報と要約文とを属性情報に追記する。
プロセッサ11は、各検索対象ファイルについて同様に要約文を生成する。
If the NVM 14 already stores the attribute information, the processor 11 adds the identification information and the abstract to the attribute information.
The processor 11 similarly generates a summary sentence for each search target file.

また、プロセッサ11は、検索情報をユーザ端末20から取得する機能を有する。
たとえば、プロセッサ11は、通信部15を通じて、検索情報の入力を受け付ける入力画面をユーザ端末20に表示させる。
The processor 11 also has a function of acquiring search information from the user terminal 20 .
For example, the processor 11 causes the user terminal 20 to display an input screen for accepting input of search information through the communication unit 15 .

ここで、ユーザは、ユーザ端末20が表示する入力画面に検索情報を入力するものとする。ユーザ端末20は、入力された検索情報を含むリクエストをサーバ10に送信する。リクエストは、検索情報に基づいてファイルを検索することを要求する。 Here, it is assumed that the user inputs search information on the input screen displayed by the user terminal 20 . The user terminal 20 transmits a request including the input search information to the server 10 . The request requests to retrieve files based on the search information.

プロセッサ11は、通信部15を通じて、検索情報を含むリクエストをユーザ端末20から受信する。 The processor 11 receives a request including search information from the user terminal 20 through the communication unit 15 .

検索情報は、検索対象ファイルを検索するための情報である。たとえば、検索情報は、検索ワードを含む。また、検索情報は、ファイルの制作者、制作日時、更新日、種類、拡張子、サイズなどを示すものであってもよい。また、検索情報は、複数の要素を含むものであってもよい。検索情報の構成は、特定の構成に限定されるものではない。 Search information is information for searching for a search target file. For example, search information includes search words. The search information may also indicate the creator of the file, date and time of creation, date of update, type, extension, size, and the like. Also, the search information may include multiple elements. The structure of search information is not limited to a specific structure.

また、プロセッサ11は、検索情報に基づいて検索対象ファイルからファイルを検索する機能を有する。 The processor 11 also has a function of searching for a file among search target files based on the search information.

検索情報を取得すると、プロセッサ11は、検索情報に基づいて検索対象ファイルからファイルを検索する。プロセッサ11は、複数のファイルを検索してもよい。 After obtaining the search information, the processor 11 searches for files from the search target files based on the search information. Processor 11 may retrieve multiple files.

たとえば、検索情報が検索ワードを含む場合、プロセッサ11は、検索対象ファイルから、テキストに検索ワードを含むファイルを検索する。プロセッサ11は、検索結果として、検索されたファイルの識別情報を取得する。 For example, if the search information contains a search word, the processor 11 searches for files containing the search word in text from the files to be searched. The processor 11 acquires identification information of the searched file as a search result.

なお、プロセッサ11は、要約文に基づいて、ファイルを検索してもよい。たとえば、属性情報が検索ワードを含む場合、プロセッサ11は、属性情報から、検索ワードを含む要約文に対応する識別情報を取得する。プロセッサ11は、検索結果として、取得された識別情報を取得してもよい。 Note that the processor 11 may search the file based on the abstract. For example, if the attribute information includes a search word, processor 11 obtains identification information corresponding to a summary including the search word from the attribute information. Processor 11 may acquire the acquired identification information as a search result.

また、プロセッサ11は、テキストに検索ワードが含まれる個数などに基づいて検索対象ファイルからファイルを検索してもよい。
プロセッサ11がファイルを検索する方法は、特定の方法に限定されるものではない。
In addition, the processor 11 may search for files from the search target files based on the number of search words included in the text.
The method by which processor 11 retrieves files is not limited to any particular method.

また、プロセッサ11は、検索されたファイルと当該ファイルの要約文とを提示する機能を有する。即ち、プロセッサ11は、検索されたファイルと当該ファイルの要約文とを出力する。 The processor 11 also has a function of presenting a retrieved file and a summary of the file. That is, the processor 11 outputs the searched file and the abstract of the file.

検索対象ファイルからファイルを検索すると、プロセッサ11は、検索されたファイルの識別情報に対応する要約文を属性情報から取得する。検索されたファイルの識別情報が複数存在する場合には、プロセッサ11は、各識別情報に対応する要約文を取得する。 After retrieving a file from the search target files, the processor 11 acquires a summary sentence corresponding to the identification information of the retrieved file from the attribute information. If there are multiple pieces of identification information for the searched file, processor 11 acquires a summary sentence corresponding to each piece of identification information.

要約文を取得すると、プロセッサ11は、通信部15を通じて、検索されたファイルの識別情報及び検索されたファイルの要約文を表示させるレスポンスをユーザ端末20に送信する。レスポンスは、検索されたファイルの識別情報及び検索されたファイルの要約文を含む。 After acquiring the digest, the processor 11 transmits to the user terminal 20 via the communication unit 15 a response for displaying the identification information of the retrieved file and the digest of the retrieved file. The response includes identification information of the retrieved file and a summary of the retrieved file.

プロセッサ11は、レスポンスをユーザ端末20に送信することで、検索されたファイルの識別情報及び要約文をユーザ端末20に表示させる。 By transmitting the response to the user terminal 20, the processor 11 causes the user terminal 20 to display the identification information and the abstract of the searched file.

図3は、プロセッサ11がユーザ端末20に表示させる画面(表示画面)の例を示す。図3が示すように、表示画面は、領域31及び領域32などから構成される。ここでは、表示画面は、複数の識別情報及び複数の要約文を表示する。 FIG. 3 shows an example of a screen (display screen) that the processor 11 causes the user terminal 20 to display. As shown in FIG. 3, the display screen includes areas 31 and 32, and the like. Here, the display screen displays multiple identification information and multiple abstracts.

領域31は、ファイルの検索結果を表示する。即ち、領域31は、検索情報に基づいて検索されたファイルの識別情報を表示する。ここでは、領域31は、3つのボックスから構成される。領域31の各ボックスは、1つの識別情報を表示する。 Area 31 displays the file search results. That is, the area 31 displays the identification information of the files searched based on the search information. Here, area 31 consists of three boxes. Each box in area 31 displays one identification.

なお、領域31は、検索されたファイルを表示又はダウンロードするリンク又はアイコンを表示するものであってもよい。 Note that the area 31 may display a link or icon for displaying or downloading the searched file.

また、領域32は、検索されたファイルの要約文を表示する。ここでは、領域32の各ボックスは、隣接する領域31のボックスの識別情報に対応する要約文を表示する。 Area 32 also displays a summary of the retrieved file. Here, each box in area 32 displays a summary sentence corresponding to the identification information of the adjacent box in area 31 .

領域32は、要約文の一部(たとえば、先頭の数行)を表示するものであってもよい。また、領域32は、要約文の全文を表示するリンク又はアイコンを表示するものであってもよい。 Area 32 may display a portion of the abstract (eg, the first few lines). Also, the area 32 may display a link or an icon that displays the full text of the abstract.

次に、サーバ10の動作例について説明する。
まず、サーバ10が要約文を生成する動作例について説明する。
図4は、サーバ10が要約文を生成する動作例について説明するためのフローチャートである。
Next, an operation example of the server 10 will be described.
First, an operation example in which the server 10 generates a summary will be described.
FIG. 4 is a flow chart for explaining an operation example in which the server 10 generates a summary sentence.

まず、サーバ10のプロセッサ11は、1つの検索対象ファイルをNVM14から取得する(S11)。1つの検索対象ファイルを取得すると、プロセッサ11は、取得された検索対象ファイルからテキストを取得する(S12)。 First, the processor 11 of the server 10 acquires one search target file from the NVM 14 (S11). After acquiring one search target file, the processor 11 acquires text from the acquired search target file (S12).

テキストを取得すると、プロセッサ11は、テキストから形態素データを生成する(S13)。形態素データを取得すると、プロセッサ11は、形態素データに基づいて要約文を生成する(S14)。 After obtaining the text, the processor 11 generates morphological data from the text (S13). After acquiring the morphological data, the processor 11 generates a summary based on the morphological data (S14).

要約文を生成すると、プロセッサ11は、当該検索対象ファイルの識別情報と要約文とを対応付けて属性情報に追記する(S15)。なお、NVM14が属性情報を格納していない場合、プロセッサ11は、属性情報を生成する。 After generating the abstract, the processor 11 associates the identification information of the search target file with the abstract and adds them to the attribute information (S15). Note that if the NVM 14 does not store attribute information, the processor 11 generates attribute information.

当該検索対象ファイルの識別情報と要約文とを対応付けて属性情報に追記すると、プロセッサ11は、要約文が未作成である検索対象ファイルが存在するかを判定する(S16)。 When the identification information of the search target file and the summary are added to the attribute information in association with each other, the processor 11 determines whether there is a search target file whose summary has not yet been created (S16).

要約文が未作成である検索対象ファイルが存在すると判定すると(S16、YES)、プロセッサ11は、S11に戻る。 If it is determined that there is a search target file whose abstract has not yet been created (S16, YES), the processor 11 returns to S11.

要約文が未作成である検索対象ファイルが存在しないと判定すると(S16、NO)、プロセッサ11は、動作を終了する。 If it is determined that there is no search target file for which no abstract has been created (S16, NO), the processor 11 terminates the operation.

次に、サーバ10が要約文を提示する動作例について説明する。
図5は、サーバ10が要約文を提示する動作例について説明するためのフローチャートである。
ここでは、NVM14は、属性情報を格納しているものとする。
Next, an operation example in which the server 10 presents a summary will be described.
FIG. 5 is a flow chart for explaining an operation example of the server 10 presenting a summary.
Here, it is assumed that the NVM 14 stores attribute information.

まず、サーバ10のプロセッサ11は、通信部15を通じて、検索情報を含むリクエストをユーザ端末20から受信する(S21)。リクエストを受信すると、プロセッサ11は、リクエストに含まれる検索情報に基づいて検索対象ファイルからファイルを検索する(S22)。 First, the processor 11 of the server 10 receives a request including search information from the user terminal 20 through the communication unit 15 (S21). Upon receiving the request, the processor 11 searches for a file from the search target files based on the search information included in the request (S22).

ファイルを検索すると、プロセッサ11は、検索されたファイルの要約文を属性情報から取得する(S23)。要約文を取得すると、プロセッサ11は、検索されたファイルの識別情報と要約文とを含むレスポンスをユーザ端末20に送信する(S24)。 After retrieving the file, the processor 11 acquires the abstract of the retrieved file from the attribute information (S23). After acquiring the abstract, the processor 11 transmits a response including the identification information of the searched file and the abstract to the user terminal 20 (S24).

レスポンスをユーザ端末20に送信すると、プロセッサ11は、動作を終了する。 After transmitting the response to the user terminal 20, the processor 11 terminates its operation.

なお、プロセッサ11は、オペレータの操作に従ってS11乃至S16を実行してもよい。また、プロセッサ11は、検索対象ファイルが追加又は更新されたタイミングで、当該検索対象ファイルについてS11乃至S16を実行してもよい。 Note that the processor 11 may execute S11 to S16 according to the operator's operation. Further, the processor 11 may execute S11 to S16 for the search target file at the timing when the search target file is added or updated.

また、プロセッサ11は、操作部16を通じて検索情報を入力してもよい。この場合、プロセッサ11は、検索されたファイルの識別情報と要約文とを表示部17に表示してもよい。 The processor 11 may also input search information through the operation unit 16 . In this case, the processor 11 may display the identification information and the abstract of the searched file on the display section 17 .

また、検索対象ファイルは、他の装置に格納されるものであってもよい。サーバ10は、他の装置から検索対象ファイルを取得して要約文を生成するものであってもよい。 Also, the search target file may be stored in another device. The server 10 may acquire a search target file from another device and generate a summary sentence.

以上のように構成された検索システムは、検索対象ファイルの要約文を生成する。また、検索システムは、ユーザからの検索のリクエストに基づいて、検索対象ファイルからファイルを検索する。検索システムは、検索されたファイルの要約文をユーザに提示する。その結果、検索システムは、ユーザが検索結果から有益なファイルを探す手間を低減させることができる。 The search system configured as described above generates a summary of a search target file. In addition, the search system searches for files from search target files based on a search request from a user. The search system presents the user with a summary of the files found. As a result, the search system can reduce the user's effort to search for useful files from the search results.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 While several embodiments of the invention have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the scope of the invention described in the claims and equivalents thereof.

1…検索システム、10…サーバ、11…プロセッサ、12…ROM、13…RAM、14…NVM、15…通信部、16…操作部、17…表示部、20…ユーザ端末、31…領域、32…領域。 Reference Signs List 1 search system 10 server 11 processor 12 ROM 13 RAM 14 NVM 15 communication unit 16 operation unit 17 display unit 20 user terminal 31 area 32 …region.

Claims (9)

プロセッサによって実行されるプログラムであって、
前記プロセッサに、
検索対象ファイルに含まれるテキストの要約文を生成する機能と、
ファイルを検索するための検索情報を取得する機能と、
前記検索情報に基づいて、前記検索対象ファイルからファイルを検索する機能と、
検索された前記ファイルを識別する識別情報と検索された前記ファイルに含まれるテキストの要約文とを出力する機能と、
を実現させるプログラム。
A program executed by a processor,
to the processor;
the ability to generate a summary of the text contained in the searched files;
A function to obtain search information for searching files;
a function of searching for a file from the search target files based on the search information;
a function of outputting identification information identifying the searched file and a summary of the text contained in the searched file;
program to realize
前記プロセッサに、
前記検索対象ファイルを識別する識別情報と前記検索対象ファイルに含まれるテキストの要約文とを対応付けた属性情報をメモリに格納する機能を実現させる、
請求項1に記載のプログラム。
to the processor;
realizing a function of storing, in a memory, attribute information that associates identification information identifying the search target file with a summary of the text contained in the search target file;
A program according to claim 1.
前記検索情報を取得することは、前記検索情報を含むリクエストを外部装置から取得することであり、
検索された前記ファイルを識別する識別情報と検索された前記ファイルに含まれるテキストの要約文とを出力することは、前記識別情報と前記要約文とを表示させるレスポンスを前記外部装置に送信することである、
請求項1又は2に記載のプログラム。
Acquiring the search information is acquiring a request including the search information from an external device;
Outputting identification information identifying the searched file and a summary of the text included in the searched file is transmitting a response for displaying the identification information and the summary to the external device. is
3. A program according to claim 1 or 2.
前記ファイルを検索することは、前記要約文に基づいて前記検索対象ファイルから前記ファイルを検索することである、
請求項1乃至3の何れか1項に記載のプログラム。
searching for the file is searching for the file from the search target files based on the abstract;
A program according to any one of claims 1 to 3.
前記検索情報は、検索ワードを含む、
請求項1乃至4の何れか1項に記載のプログラム。
The search information includes a search word,
A program according to any one of claims 1 to 4.
前記要約文を生成することは、
前記テキストから前記テキストの形態素を示す形態素データを生成し、
前記形態素データに基づいて前記要約文を生成することである、
請求項1乃至5の何れか1項に記載のプログラム。
Generating the summary sentence includes:
generating morpheme data representing morphemes of the text from the text;
generating the summary sentence based on the morphological data;
A program according to any one of claims 1 to 5.
前記要約文を生成することは、前記形態素データを生成モデルに入力して前記要約文を生成することである、
請求項6に記載のプログラム。
generating the summary sentence is inputting the morphological data into a generative model to generate the summary sentence;
7. A program according to claim 6.
前記生成モデルは、ニューラルネットワークの入力層に入力された前記形態素データに対して、前記ニューラルネットワークの重み付け係数に基づく演算を行い、前記ニューラルネットワークの出力層から前記要約文を出力するように、前記プロセッサに機能させるためのモデルであって、
前記重み付け係数は、前記形態素データと前記要約文とを教師データとした学習によって得られる、
請求項7に記載のプログラム。
The generative model performs an operation based on the weighting coefficients of the neural network on the morphological data input to the input layer of the neural network, and outputs the summary sentence from the output layer of the neural network. A model for making a processor work,
The weighting coefficient is obtained by learning using the morpheme data and the summary sentence as teacher data,
8. A program according to claim 7.
プロセッサによって実行される情報処理方法であって、
検索対象ファイルに含まれるテキストの要約文を生成し、
ファイルを検索するための検索情報を取得し、
前記検索情報に基づいて、前記検索対象ファイルからファイルを検索し、
検索された前記ファイルを識別する識別情報と検索された前記ファイルに含まれるテキストの要約文とを出力する、
情報処理方法。
An information processing method performed by a processor, comprising:
generate a summary of the text contained in the searched files,
Get search information to search for files,
searching for a file from the search target file based on the search information;
outputting identification information identifying the retrieved files and a summary of the text contained in the retrieved files;
Information processing methods.
JP2022005031A 2022-01-17 2022-01-17 Program and information processing method Pending JP2023104183A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022005031A JP2023104183A (en) 2022-01-17 2022-01-17 Program and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022005031A JP2023104183A (en) 2022-01-17 2022-01-17 Program and information processing method

Publications (1)

Publication Number Publication Date
JP2023104183A true JP2023104183A (en) 2023-07-28

Family

ID=87379695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022005031A Pending JP2023104183A (en) 2022-01-17 2022-01-17 Program and information processing method

Country Status (1)

Country Link
JP (1) JP2023104183A (en)

Similar Documents

Publication Publication Date Title
US10606959B2 (en) Highlighting key portions of text within a document
US8275781B2 (en) Processing documents by modification relation analysis and embedding related document information
US7552400B1 (en) System and method for navigating within a graphical user interface without using a pointing device
US20080249977A1 (en) Similar files management apparatus and method and program therefor
KR20030034037A (en) Control Apparatus And Contol Method For Starting Application Software On A Computer, And Multi-Moniter Computer, Client-Server System, And Storage Medium Using The Same
US8290928B1 (en) Generating sitemap where last modified time is not available to a network crawler
JPWO2004111876A1 (en) Search system and method for reusing search conditions
WO2019151502A1 (en) Presentation device, presentation method and presentation program
US20160179759A1 (en) Persona based content modification
US11436029B2 (en) Help information display system, help information display method, and help information display program
JP2023104183A (en) Program and information processing method
WO2022014629A1 (en) Webpage processing device, webpage processing method, and recording medium
JP7247593B2 (en) Generation device, software robot system, generation method and generation program
JP5703244B2 (en) Trace support device, trace support system, trace support method, and trace support program
JP2015141540A (en) Information processor, wording association presentation system, and information processing program
JP4000332B2 (en) Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP7295463B2 (en) Business flow creation support device, business flow creation support method, and business flow creation support program
JP2018018551A (en) Document management device, document management system, document management method, and document management program
WO2023171790A1 (en) Text creation assistance device and text creation assistance program
JP3734101B2 (en) Hypermedia construction support device
JP2007041864A (en) Metadata acquisition/management method, apparatus and program
JP2008191879A (en) Information display device, display method for information display device, information display program, and recording medium with information display program recorded
JP2003323441A (en) Image medical chart management system
JP2006215829A (en) Document management device, document management method and computer program
JP2000057128A (en) Method and device for managing document, and storage medium

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105