JP2005157547A - Similar article extracting method and program - Google Patents

Similar article extracting method and program Download PDF

Info

Publication number
JP2005157547A
JP2005157547A JP2003392275A JP2003392275A JP2005157547A JP 2005157547 A JP2005157547 A JP 2005157547A JP 2003392275 A JP2003392275 A JP 2003392275A JP 2003392275 A JP2003392275 A JP 2003392275A JP 2005157547 A JP2005157547 A JP 2005157547A
Authority
JP
Japan
Prior art keywords
keyword
article
data
storage unit
article data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003392275A
Other languages
Japanese (ja)
Inventor
悟朗 ▲高▼木
Goro Takagi
Shinji Honma
真二 本間
Akira Iwafune
晃 岩船
Jun Kishi
純 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003392275A priority Critical patent/JP2005157547A/en
Publication of JP2005157547A publication Critical patent/JP2005157547A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a new technology to present proper similar data. <P>SOLUTION: This similar article extracting method comprises a step for receiving message data as retrieval conditions, and for storing the message data in a message storing part, a step for extracting article data corresponding to the message data stored in the message data storing part from an article data storing part by using a predetermined algorithm, and for storing the message data in an extracted article data storing part, a step for extracting keyword candidates different from a keyword for retrieval preliminarily associated with the article data stored in the extracted article data storing part from among keyword candidates included in the message data stored in the message data storing part when predetermined conditions are satisfied, and for storing the keyword candidates in a non-solution keyword storing part and a step for associating the keyword candidates stored in the non-solution keyword storing part or words and phrases designated by a user as exclusion keywords with the article data stored in the extracted article data storing part, and for updating and registering the article data in the article data storing part. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、類似記事検索のための技術に関するものである。   The present invention relates to a technique for searching for similar articles.

ユーザからの質問を受け付けて回答を提示するシステムにおいて、全ての質問に対して個別に回答する手間を省くために、類似の質問が含まれる過去のデータをユーザに提示する技術が一般的に用いられている。   In a system that accepts questions from users and presents answers, a technique that presents users with past data containing similar questions is generally used to save the trouble of individually answering all questions. It has been.

例えば、電子メールにおける段落を分析することにより、質問の段落及び回答の段落を特定し、過去の質問に類似する質問に対しては自動的に回答するような技術が存在する(例えば特許文献1参照)。すなわち、段落機能解析手段は、段落機能決定規則蓄積手段の段落機能決定規則に基づき、電子メールの本文から質問の段落を解析する。また、前の段落が質問であり且つ引用文であった場合、その段落は回答であるという段落機能決定規則により、回答の段落を判定する。回答検索手段は、電子メールで質問の段落が含まれていた場合、質問の段落から任意のキーワードを抽出し、このキーワードに基づき、同様のキーワードを有する質問を有し、且つその回答を有する電子メールを検索し、検索の結果得られた電子メールの回答を、質問の電子メールに対する回答と決定する。   For example, there is a technique for identifying a question paragraph and an answer paragraph by analyzing a paragraph in an e-mail and automatically answering a question similar to a past question (for example, Patent Document 1). reference). In other words, the paragraph function analysis means analyzes the paragraph of the question from the body of the e-mail based on the paragraph function decision rules of the paragraph function decision rule storage means. If the previous paragraph is a question and a quoted sentence, the paragraph of the answer is determined based on the paragraph function decision rule that the paragraph is an answer. When a question paragraph is included in the e-mail, the answer search means extracts an arbitrary keyword from the question paragraph, and based on this keyword, the e-mail has a question having a similar keyword and has the answer. An email is searched, and an email response obtained as a result of the search is determined as an answer to the email of the question.

また例えば、質問データからキーワードを抽出し、当該キーワードに基づき過去の類似質問を検索してユーザに示す技術も存在する(例えば特許文献2参照)。すなわち、質問送信端末と、質問受信サーバとがネットワークで接続されている質問管理システムを用い、端末で入力された新規質問をサーバへ送信し、サーバの記憶装置に保持された辞書と過去質問とを参照しながら、新規質問からキーワードを抽出し、キーワードと過去質問中のキーワードとが1以上一致する過去質問を質問送信端末へ送信し、送信した過去質問の全てが新規質問と内容が異なるという指示を質問送信端末から受信した場合には、新規質問をサーバの記憶装置に保持する。   Further, for example, there is a technique in which a keyword is extracted from question data, a past similar question is searched based on the keyword, and the user is shown (for example, see Patent Document 2). That is, using a question management system in which a question sending terminal and a question receiving server are connected via a network, a new question inputted at the terminal is sent to the server, and a dictionary and past questions held in the storage device of the server The keyword is extracted from the new question while referring to, the past question in which one or more keywords match the keyword in the past question is transmitted to the question transmission terminal, and all of the transmitted past questions are different from the new question. When the instruction is received from the question transmission terminal, the new question is held in the storage device of the server.

また例えば、教育用システムにおいて、ユーザによる類似質問の検索を可能とする技術も存在する(例えば特許文献3参照)。すなわち、質問者である生徒が回答要求を行うと、回答者情報に設定されている複数の回答者に対し優先順位に基づいて間い合わせを行い、空いている回答者に質問を送信する。また、全ての回答者が回答中の場合は、回答者情報に設定されている回答者全員にリクエストイベントを送り、質問は質問待ちバッファに格納し、現在の回答処理が終了するまで待機し、リクエストイベントに基づいて回答者から質問開始の合図が送られてきたら質問を行う。また、生徒は、リクエストイベントの制限待ち時間を過ぎたなら、質問待ちバッファの内容をそのまま電子メールとして回答者に送信することによって後で回答を得るか、過去の質問とその回答が蓄積されているデータベースを参照して類似する質問の検索を行うことによって、もし類似する質問が存在すればその時に回答を得る。
特開平10−254795号公報 特開2002−324163号公報 特開平8−235089号公報
In addition, for example, there is a technology that enables a user to search for similar questions in an educational system (see, for example, Patent Document 3). That is, when a student who is a questioner makes an answer request, he / she makes an inquiry based on the priority order for a plurality of answerers set in the answerer information, and transmits the question to the available answerers. Also, if all respondents are answering, send a request event to all respondents set in the respondent information, store the question in the question waiting buffer, wait until the current answer processing ends, If a respondent receives a signal to start a question based on the request event, ask the question. Also, if the request event time limit has passed, the student can obtain an answer later by sending the contents of the question waiting buffer as an e-mail to the respondent as it is, or past questions and their answers are accumulated. By searching for similar questions by referring to a database, if there is a similar question, an answer is obtained at that time.
Japanese Patent Laid-Open No. 10-25495 JP 2002-324163 A JP-A-8-235089

しかしながら、このような従来技術によると、例えばユーザが質問を投稿した場合に、類似の過去の質問及び回答データが大量にユーザに提示される場合があり得る。そして、ユーザは、提示された大量のデータの中から自分が必要としているデータを見つけ出さなければならない。但し、あくまでも類似のデータであるため、必ずしもその中にユーザが求めているものがあるとは限らない。そのため、データの蓄積量の増加に伴い、ユーザが回答を得にくくなってしまうというようなことが考えられる。また、例えばあるユーザが特定の質問に対する類似のデータを参照して、必要とするデータがなかったことが分かったとしても、例えば他のユーザが同様の質問を投稿すると、同様の類似データが提示されてしまう。すなわち、ユーザにとって適切な類似データの参照を可能としているとは言えない。   However, according to such a conventional technique, for example, when a user posts a question, similar past question and answer data may be presented to the user in large quantities. The user must find out the data he needs from the large amount of data presented. However, since it is similar data to the last, there is not always what the user is seeking. For this reason, it is conceivable that it becomes difficult for the user to obtain an answer as the amount of accumulated data increases. For example, even if a certain user refers to similar data for a specific question and finds that there is no data required, for example, when another user posts a similar question, similar similar data is presented. Will be. That is, it cannot be said that similar data appropriate for the user can be referred to.

なお、このような質問回答システム等では、類似と判定する範囲を狭くするなど、あまり厳密な検索を行うようにすると、類似のデータが検索されないケースが増え、適切ではない。   In such a question answering system or the like, if a strict search is performed such as narrowing the range to be determined as similar, the number of cases where similar data is not searched increases, which is not appropriate.

そのため、本発明の目的は、適切な類似データを提示するための新規な技術を提供することである。   Therefore, an object of the present invention is to provide a novel technique for presenting appropriate similar data.

本発明に係る方法は、検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納するステップと、所定のアルゴリズムを用いて、メッセージ・データ格納部に格納されたメッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納するステップと、所定の条件が満たされた場合、メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、抽出記事データ格納部に格納された記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納するステップと、非解決キーワード格納部に格納されたキーワード候補又はユーザから指定された語句を、除外キーワードとして抽出記事データ格納部に格納された記事データに対応付けて記事データ格納部に更新登録するステップとを含む。   In the method according to the present invention, when message data as a search condition is received, the message data stored in the message data storage unit is stored in the message data storage unit using a predetermined algorithm. The step of extracting corresponding article data from the article data storage unit and storing it in the extracted article data storage unit, and a keyword included in the message data stored in the message data storage unit when a predetermined condition is satisfied Of the candidates, extracting a keyword candidate different from the search keyword previously associated with the article data stored in the extracted article data storage unit, storing the keyword candidate in the unresolved keyword storage unit, Stored keyword candidates or phrases specified by the user as negative keywords And updating registration in the article data storage unit in association with the article stored in the output article data storage unit data.

このように、検索対象となる記事データに除外キーワードを対応付けることにより、通常の検索用キーワードによる検索に加えて、除外キーワードを用いた検索も可能となる。例えば特定の除外キーワードを含む検索条件(メッセージ・データ)に対して、同一の除外キーワードが対応付けられた記事データを抽出しないというような検索処理も可能となる。これによれば、ユーザに示す記事データを絞り込むことができる。   In this way, by associating an excluded keyword with article data to be searched, it is possible to perform a search using an excluded keyword in addition to a normal search keyword search. For example, it is possible to perform a search process in which article data associated with the same exclusion keyword is not extracted for a search condition (message data) including a specific exclusion keyword. According to this, article data shown to the user can be narrowed down.

また、上記所定のアルゴリズムが、メッセージ・データに含まれる、少なくとも一部の語句に一致する検索用キーワードが対応付けられている第1記事データの抽出、及び抽出された当該第1記事データのうち、メッセージ・データに含まれる、少なくとも一部の語句に一致する除外キーワードが対応付けられている記事データを除いた第2記事データを抽出するためのアルゴリズムであってもよい。   In addition, the predetermined algorithm includes extraction of first article data associated with search keywords that match at least some of the words included in the message data, and among the extracted first article data An algorithm for extracting second article data excluding article data associated with excluded keywords that match at least some of the phrases included in the message data may be used.

これにより、検索キーワードにより抽出された第1記事データと、第1記事データを除外キーワードにより絞り込んだ第2記事データとを特定しておくことができる。そして、例えばユーザの要求によって、第1記事データを示したり第2記事データを示したりすることができる。   Thereby, the 1st article data extracted by the search keyword and the 2nd article data which narrowed down the 1st article data by the exclusion keyword can be specified. For example, the first article data or the second article data can be indicated by a user request.

また、第2記事データの内容をユーザが確認するためのデータを生成し、出力するステップと、第2記事データの内容を確認したユーザからの要求に従って、第1記事データの内容をユーザが確認するためのデータを生成し、出力するステップとをさらに含むようにしてもよい。   Further, the user confirms the content of the first article data in accordance with a step of generating and outputting data for the user to confirm the content of the second article data, and a request from the user who confirmed the content of the second article data. A step of generating and outputting data for performing the processing.

このように、絞り込まれた(件数が少ない可能性が高い)データである第2記事データをまず始めにユーザに示し、ユーザからの要求があれば、絞り込まれていない第1記事データを示すことにより、除外キーワードによる絞込みが有効に作用しない場合にも対処可能となる。   In this way, the second article data, which is data that has been narrowed down (highly likely to be small in number), is first shown to the user, and if there is a request from the user, the first article data that has not been narrowed down is shown. Thus, it is possible to cope with the case where narrowing down by the excluded keyword does not work effectively.

また、上記所定の条件が、抽出記事データ格納部に格納された記事データの内容が不十分であるというユーザからの指示を検知することであってもよい。このように、ユーザが求めている記事ではないのに検索にヒットした記事データについて除外キーワードが設定されるようにすると、例えばその後、他のユーザにより同様の検索条件で検索が行われたとしても、除外キーワードが設定されている記事データ(当該検索においてユーザが求めている記事ではない可能性が高い記事データ)は提示されないようになる。すなわち、他のユーザの利便性が高まる。   The predetermined condition may be to detect an instruction from the user that the content of the article data stored in the extracted article data storage unit is insufficient. In this way, if an exclusion keyword is set for article data that has not been searched for by the user but hit the search, for example, even if a search is performed under the same search condition by another user thereafter. Article data in which an exclusion keyword is set (article data that is highly likely not to be an article requested by the user in the search) is not presented. That is, convenience for other users is enhanced.

なお、本発明に係る方法をコンピュータに実行させるためのプログラムを作成することも可能であって、当該プログラムは、例えばフレキシブル・ディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してデジタル信号として配信される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。   It is also possible to create a program for causing a computer to execute the method according to the present invention, and the program is a storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, and a hard disk. Alternatively, it is stored in a storage device. Moreover, it may be distributed as a digital signal via a network. Note that data being processed is temporarily stored in a storage device such as a computer memory.

本発明によれば、ユーザにとって不要である可能性の高いものを除外した類似データをユーザに示すことができ、適切な類似データの提示を行うことができる。   ADVANTAGE OF THE INVENTION According to this invention, the similar data which excluded the thing which has a high possibility of being unnecessary for a user can be shown to a user, and suitable similar data can be shown.

本発明の一実施の形態に係るシステム構成図を図1に示す。例えば企業内ネットワークであるネットワーク1には、例えばパーソナル・コンピュータである1又は複数のユーザ端末3、担当者端末7及び管理者端末9と、質問及び回答を投稿又は検索するための電子掲示板サービスを行うQA(Question and Answer)サーバ5とが無線又は有線により接続されている。なお、ネットワーク1がインターネット等、他のネットワークの場合もある。   A system configuration diagram according to an embodiment of the present invention is shown in FIG. For example, in the network 1 which is an in-house network, for example, one or a plurality of user terminals 3 which are personal computers, a person-in-charge terminal 7 and an administrator terminal 9, and an electronic bulletin board service for posting or searching for questions and answers are provided. A QA (Question and Answer) server 5 to be performed is connected wirelessly or by wire. The network 1 may be another network such as the Internet.

また、ユーザ端末3、担当者端末7、管理者端末9及びQAサーバ5は、図2に示すようなコンピュータ装置であって、メモリ201とCPU203とハードディスク・ドライブ(HDD)205と表示装置209に接続される表示制御部207とリムーバブル・ディスク211用のドライブ装置213と入力装置215とネットワークに接続するための通信制御部217とがバス219で接続されている。オペレーティング・システム(OS:Operating System)及び本実施の形態における処理を実現するためのプログラムを含むアプリケーション・プログラムは、HDD205に格納されており、CPU203により実行される際にはHDD205からメモリ201に読み出される。必要に応じてCPU203は、表示制御部207、通信制御部217、ドライブ装置213を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ201に格納され、必要があればHDD205に格納される。本発明の実施の形態における処理を実現するためのプログラムは例えばリムーバブル・ディスク211に格納されて頒布されドライブ装置213から、又はネットワーク及び通信制御部217を介して受信し、HDD205にインストールされる。このようなコンピュータ装置は、上で述べたCPU203、メモリ201などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、以下で説明する各種機能を実現する。   The user terminal 3, the person-in-charge terminal 7, the administrator terminal 9, and the QA server 5 are computer devices as shown in FIG. 2, and include a memory 201, a CPU 203, a hard disk drive (HDD) 205, and a display device 209. A display control unit 207 to be connected, a drive device 213 for the removable disk 211, an input device 215, and a communication control unit 217 for connecting to a network are connected by a bus 219. An application program including an operating system (OS) and a program for realizing processing in the present embodiment is stored in the HDD 205, and is read from the HDD 205 to the memory 201 when executed by the CPU 203. It is. If necessary, the CPU 203 controls the display control unit 207, the communication control unit 217, and the drive device 213 to perform necessary operations. Further, data in the middle of processing is stored in the memory 201, and if necessary, stored in the HDD 205. A program for realizing the processing in the embodiment of the present invention is stored in the removable disk 211 and distributed, for example, is received from the drive device 213 or via the network and communication control unit 217, and is installed in the HDD 205. Such a computer apparatus realizes various functions described below by organically cooperating hardware such as the CPU 203 and the memory 201 described above with the OS and necessary application programs.

図1の説明に戻り、ユーザ端末3及び担当者端末7は、各々ウェブ(Web)ブラウザ機能を有し、例えばQAサーバ5からネットワーク1を介して送信されたWebページ・データを受信して表示することが可能となっている。管理者端末9は以下に述べる各データベース(DB)に対してアクセスする機能を有し、システム管理者等によるデータの登録や修正等を可能としている。   Returning to the description of FIG. 1, the user terminal 3 and the person-in-charge terminal 7 each have a web browser function, and receive and display web page data transmitted from the QA server 5 via the network 1, for example. It is possible to do. The administrator terminal 9 has a function of accessing each database (DB) described below, and enables registration or correction of data by a system administrator or the like.

QAサーバ5には、DBアクセス部51と品詞分解部53と非解決キーワード抽出部55とWebサーバ部57とワーク・メモリ領域500とが含まれており、QADB560とキーワードDB570と担当者DB580とが接続されている。なお、QADB560とキーワードDB570と担当者DB580とは、必ずしも別のDBで構成されている必要はなく、例えば一つのDB内に、上の各DBに対応するテーブルが含まれるようにしてもよい。また、QAサーバ5のワーク・メモリ領域500には、投稿データ格納部510と類似記事データ格納部520と絞込記事データ格納部530と分解キーワード格納部540と非解決キーワード格納部550とが含まれている。   The QA server 5 includes a DB access unit 51, a part-of-speech decomposition unit 53, an unresolved keyword extraction unit 55, a Web server unit 57, and a work memory area 500. A QDB 560, a keyword DB 570, and a person-in-charge DB 580 are included. It is connected. The QDBB 560, the keyword DB 570, and the person-in-charge DB 580 are not necessarily configured as separate DBs. For example, a table corresponding to each of the above DBs may be included in one DB. Further, the work memory area 500 of the QA server 5 includes a posted data storage unit 510, a similar article data storage unit 520, a narrowed article data storage unit 530, a decomposition keyword storage unit 540, and an unresolved keyword storage unit 550. It is.

各処理部及び各格納部についての具体的な説明は後述するが、DBアクセス部51は、QADB560とキーワードDB570と担当者DB580とに対してデータを登録したり、登録されたデータの検索処理を行う。品詞分解部53は、例えば質問メッセージであるメッセージ・データを品詞分解し、例えば単語単位のデータにする。なお、品詞分解の方法については従来技術を用いればよく、詳しい説明は省略する。また、本実施の形態では日本語の品詞分解を行うような構成となっているが、他の言語を品詞分解するような場合もある。   A specific description of each processing unit and each storage unit will be described later, but the DB access unit 51 registers data in the QADB 560, the keyword DB 570, and the person-in-charge DB 580, or performs a search process for registered data. Do. The part-of-speech decomposition unit 53 performs part-of-speech decomposition on message data that is, for example, a question message, for example, to make data in units of words. Note that conventional techniques may be used for the method of part-of-speech decomposition, and detailed description thereof is omitted. Further, although the present embodiment is configured to perform Japanese part-of-speech decomposition, other parts of speech may be decomposed.

非解決キーワード抽出部55は、検索条件である質問メッセージに含まれ、且つ検索にヒットした記事データに対応付けられている検索用キーワードに含まれていないキーワードを抽出する。例えば、ユーザが質問を投稿して類似の記事を参照した際、ユーザが求める回答が類似の記事に含まれていない場合がある。後でも述べるが、各記事には検索用のキーワードが対応付けられており、この検索用キーワードが質問メッセージに含まれている記事が、類似の記事として提示される。ユーザが求める回答が類似の記事に含まれていないという場合には、通常、質問メッセージに含まれ且つ類似の記事の検索用キーワードに含まれないキーワードが存在するため、そのようなキーワードを非解決キーワードとして抽出する。   The unresolved keyword extraction unit 55 extracts a keyword that is included in the question message that is the search condition and that is not included in the search keyword associated with the article data hit in the search. For example, when a user posts a question and refers to a similar article, the answer that the user requests may not be included in the similar article. As will be described later, a search keyword is associated with each article, and an article in which the search keyword is included in the question message is presented as a similar article. If the answer requested by the user is not included in a similar article, there is usually a keyword that is included in the question message and not included in the search keywords for similar articles. Extract as keywords.

Webサーバ部57は、一般的なWebサーバ機能を有し、例えばWebページ・データを生成してネットワーク1を介してユーザ端末3等に送信する。投稿データ格納部510は、質問や回答等、ユーザからの投稿データを一時記憶しておくための記憶部である。類似記事データ格納部520は、類似記事検索にヒットした記事データを一時記憶しておくための記憶部である。絞込記事データ格納部530は、類似記事検索にヒットし且つ除外キーワードによる絞込みを行った記事データを一時記憶しておくための記憶部である。   The Web server unit 57 has a general Web server function and generates, for example, Web page data and transmits it to the user terminal 3 or the like via the network 1. The post data storage unit 510 is a storage unit for temporarily storing post data from the user such as questions and answers. The similar article data storage unit 520 is a storage unit for temporarily storing article data hit in the similar article search. The narrowed article data storage unit 530 is a storage unit for temporarily storing article data that has been hit by a similar article search and has been narrowed down by an excluded keyword.

分解キーワード格納部540は、品詞分解部53により例えば単語単位に分解されたメッセージ・データ、すなわち品詞分解部53の処理結果を一時記憶しておくための記憶部である。非解決キーワード格納部550は、分解キーワード格納部540に格納されたデータのうち、検索用キーワードにヒットしなかったキーワード、すなわち非解決キーワード抽出部55の処理結果を一時記憶しておくための記憶部である。   The decomposition keyword storage unit 540 is a storage unit for temporarily storing the message data decomposed, for example, in units of words by the part of speech decomposition unit 53, that is, the processing result of the part of speech decomposition unit 53. The unresolved keyword storage unit 550 temporarily stores a keyword that does not hit the search keyword among the data stored in the decomposition keyword storage unit 540, that is, a processing result of the unresolved keyword extraction unit 55. Part.

図3に、QADB560のテーブル構成及び格納されるデータの一例を示す。図3の例には、記事番号(NO)の列300と種別の列302と質問者メールアドレスの列304と質問者氏名の列306と質問者部署の列308と質問日時の列310と質問の列312とタイトルの列314と回答者氏名の列316と回答者部署の列318と回答日時の列320と回答の列322とが含まれている。レコードは質問者であるユーザから新規の質問の投稿を受け付けた際に生成され、記事番号(NO)の列300と種別の列302と質問者メールアドレスの列304と質問者氏名の列306と質問者部署の列308と質問日時の列310と質問の列312とタイトルの列314とに値が登録される。ここで、新規の質問とは、類似の記事を参照しても回答が得られないような内容の質問を指す。そして、回答者からの回答の投稿を受け付けた際に、回答者氏名の列316と回答者部署の列318と回答日時の列320と回答の列322とに値が登録される。   FIG. 3 shows an example of the table configuration of QADB 560 and stored data. 3 includes an article number (NO) column 300, a type column 302, a questioner email address column 304, a questioner name column 306, a questioner department column 308, a question date column 310, and a question. Column 312, title column 314, respondent name column 316, respondent department column 318, answer date / time column 320, and answer column 322. The record is generated when a new question is received from a user who is a questioner, and includes an article number (NO) column 300, a type column 302, a questioner email address column 304, and a questioner name column 306. Values are registered in the questioner department column 308, the question date and time column 310, the question column 312, and the title column 314. Here, the new question refers to a question that cannot be answered even if a similar article is referenced. Then, when accepting a reply from the respondent, values are registered in the respondent name column 316, the respondent department column 318, the reply date / time column 320, and the reply column 322.

レコードは記事番号(NO)の列300の値によって一意に特定される。また、記事番号(NO)の列300と質問日時の列310と回答日時の列318とには、システムによって自動的に値が登録される。種別の列302には、質問の内容がどのようなカテゴリに分類されるか質問者が判断し、選択したものが登録される。なお、種別の列302と質問者氏名の列306と質問者部署の列308と回答者氏名の列314と回答者部署の列316とには、所定のコードが登録されるような場合もある。   The record is uniquely identified by the value in the column 300 of the article number (NO). Further, values are automatically registered in the article number (NO) column 300, the question date column 310, and the answer date column 318 by the system. In the type column 302, the questioner determines which category the question is classified into, and the selected item is registered. In addition, a predetermined code may be registered in the type column 302, the questioner name column 306, the questioner department column 308, the respondent name column 314, and the answerer department column 316. .

図4に、キーワードDB570のテーブル構成及び格納されるデータの一例を示す。図4の例には、対応記事番号(NO)の列400と類似記事検索用キーワードの列402と解決しなかったキーワードの列404とが含まれている。レコードはQADB560のレコードに対応して生成され、まず対応記事番号(NO)の列400と類似記事検索用キーワードの列402とに値が登録される。対応記事番号(NO)の列400には、対応するQADB560のレコードの記事番号(NO)の列300の値が登録され、レコードは対応記事番号(NO)の列400の値によって一意に特定される。そして、解決しなかったキーワードの列404には、上で述べた除外キーワードが格納される。例えば図4に示した例の1行目から3行目のレコードには「ホームページアドレス」と登録されているが、これは当該レコードに対応する記事データは「ホームページアドレス」というキーワードを含む検索(質問)には回答を示さないことを表している。なお、QADB560のテーブルとキーワードDB570のテーブルとは、主キーとなる項目内容が同一であるため、結合して1つのテーブルにしてもよい。   FIG. 4 shows an example of the table configuration of the keyword DB 570 and stored data. The example of FIG. 4 includes a corresponding article number (NO) column 400, a similar article search keyword column 402, and a keyword column 404 that has not been resolved. Records are generated corresponding to the records of the QADB 560, and values are first registered in the column 400 of the corresponding article number (NO) and the column 402 of similar article search keywords. In the corresponding article number (NO) column 400, the value of the article number (NO) column 300 of the corresponding QADB 560 record is registered, and the record is uniquely identified by the value of the corresponding article number (NO) column 400. The Then, in the keyword column 404 that has not been solved, the excluded keywords described above are stored. For example, “homepage address” is registered in the records from the first line to the third line in the example shown in FIG. 4, and this is because the article data corresponding to the record includes the keyword “homepage address” ( (Question) indicates that no answer is given. Since the QADB 560 table and the keyword DB 570 table have the same item content as the primary key, they may be combined into one table.

図5に、担当者DB580のテーブル構成及び格納されるデータの一例を示す。図5の例には、種別の列500と担当者・担当部署名の列502とメールアドレスの列504とが含まれている。レコードは例えばシステム管理者が管理者端末9を操作することにより設定登録される。また、レコードは種別の列500の値によって一意に特定される。担当者・担当部署名の列502には、質問の種別(種別の列500の値)に対応する回答担当者又は部署の名称が登録される。すなわち、例えばシステム管理者が「この分類の質問に回答するのはこの人」というように設定する。なお、担当者ではなく担当部署を設定する場合には、メールアドレスの列504には個人のメールアドレスではなく例えば部署のメーリングリストのアドレスを登録する。   FIG. 5 shows an example of the table configuration of the person-in-charge DB 580 and stored data. The example of FIG. 5 includes a type column 500, a person in charge / department signature column 502, and a mail address column 504. Records are set and registered when the system administrator operates the administrator terminal 9, for example. Further, the record is uniquely identified by the value in the type column 500. In the person-in-charge / department-signature column 502, the name of the person in charge of the answer or the department corresponding to the question type (value in the type column 500) is registered. That is, for example, the system administrator sets such that “this person answers the question of this classification”. When the department in charge is set instead of the person in charge, for example, the mailing list address of the department is registered in the mail address column 504 instead of the personal mail address.

次に、図6乃至図11を用いて、図1に示したシステムの処理内容について説明する。なお、図6に示した処理フローの前提として、ユーザ端末3の表示画面には、ユーザ端末3のWebブラウザとQAサーバ5のWebサーバ部57との処理によって質問入力用のページが表示されているものとする。システムを利用する際にログインが必要な場合にはログイン処理もなされているものとする。まず、ユーザ端末3のWebブラウザ(以下、ユーザ端末3と省略する)は、質問者であるユーザからの質問入力及び投稿要求を受け付ける(図6:ステップS1)。図示しないが、例えば表示されているページに含まれるテキストボックスや投稿ボタン等によって質問データの入力及び投稿要求を受け付ける。そして、ユーザ端末3は、入力された質問データをQAサーバ5に送信する(ステップS3)。   Next, processing contents of the system shown in FIG. 1 will be described with reference to FIGS. As a premise of the processing flow shown in FIG. 6, a question input page is displayed on the display screen of the user terminal 3 by processing of the Web browser of the user terminal 3 and the Web server unit 57 of the QA server 5. It shall be. If login is required when using the system, login processing is also performed. First, a Web browser of the user terminal 3 (hereinafter abbreviated as “user terminal 3”) receives a question input and a posting request from a user who is a questioner (FIG. 6: step S1). Although not shown, input of question data and a posting request are accepted by, for example, a text box or a posting button included in the displayed page. Then, the user terminal 3 transmits the input question data to the QA server 5 (step S3).

QAサーバ5のWebサーバ部57は、質問データをユーザ端末3から受信し、ワーク・メモリ領域500の投稿データ格納部510に格納する(ステップS5)。なお、受信する質問データには、質問の種別、質問者のメールアドレス、質問者氏名、質問者部署、タイトル及び質問文(必ずしも文章でなくともよい)が含まれており、受信した日時である質問日時を含めて質問データとして格納しておく。なお、質問者のメールアドレス、質問者氏名及び質問者部署については、必ずしもこの時点で質問データに含まれている必要はなく、QADB560に新規レコードを登録する際に、ログイン情報から特定したり、ユーザに入力を促すようにしてもよい。   The Web server unit 57 of the QA server 5 receives the question data from the user terminal 3 and stores it in the posted data storage unit 510 of the work memory area 500 (step S5). The received question data includes the type of question, the email address of the questioner, the name of the questioner, the department of the questioner, the title, and the question text (not necessarily a sentence), and is the date and time of reception. Store as question data including question date and time. The questioner's email address, the name of the questioner, and the department of the questioner do not necessarily need to be included in the question data at this point. When registering a new record in the QADB 560, The user may be prompted to input.

そして、QAサーバ5のDBアクセス部51は、キーワードDB570及びQADB560を参照し、質問メッセージ(タイトル及び質問文)に含まれる少なくとも一部の語句に一致する検索用キーワードが対応付けられている記事データ(QADB560のレコード)を抽出してワーク・メモリ領域500の類似記事データ格納部520に格納する(ステップS7)。   Then, the DB access unit 51 of the QA server 5 refers to the keyword DB 570 and the QADB 560, and article data in which search keywords that match at least some of the phrases included in the question message (title and question sentence) are associated. (QADB 560 record) is extracted and stored in the similar article data storage unit 520 of the work memory area 500 (step S7).

例えば、質問メッセージがタイトルのみで「ログイン方法を教えて下さい。」というものであり、キーワードDB570に図4に示したようなデータが格納されていた場合、キーワードDB570からは「ログイン」という検索用キーワード(類似記事検索用キーワードの列402の値)が対応付けられている、1行目及び4行目のレコードが特定される。そして、キーワードDB570の1行目及び4行目のレコードの対応記事番号(NO)の列400の値である「135」及び「138」を用いてQADB560を検索する。QADB560に図3に示したようなデータが格納されていた場合、記事番号(NO)の列300(図3)の値が「135」のレコード及び「138」のレコードである1行目及び4行目のレコードが抽出される。   For example, if the question message is only the title and “Please tell me how to log in.” And the data shown in FIG. 4 is stored in the keyword DB 570, the search from the keyword DB 570 is “Login”. The records in the first and fourth lines with which the keywords (values in the similar article search keyword column 402) are associated are specified. Then, the QADB 560 is searched using “135” and “138” which are the values in the column 400 of the corresponding article number (NO) of the records in the first and fourth rows of the keyword DB 570. When the data as shown in FIG. 3 is stored in the QADB 560, the first row and the fourth row in which the value of the column 300 (FIG. 3) of the article number (NO) is “135” and the record of “138” are shown. The record of the line is extracted.

そして、DBアクセス部51は、ステップS7においてレコードが抽出されたか判定する(ステップS9)。レコードが抽出されなかったと判定された場合(ステップS9:Noルート)、QAサーバ5の品詞分解部53は、質問メッセージを品詞分解して1又は複数のキーワードを抽出し、ワーク・メモリ領域500の分解キーワード格納部540に格納する(ステップS11)。なお、質問メッセージが単語の羅列等である場合には、品詞分解しない場合もある。そして、DBアクセス部51は、質問データ及びステップS11において抽出されたキーワードに基づき、QADB560及びキーワードDB570に新規レコードを登録する(ステップS13)。そして、後に述べるステップS27の処理に移行する。   Then, the DB access unit 51 determines whether a record is extracted in step S7 (step S9). If it is determined that the record has not been extracted (step S9: No route), the part of speech decomposition unit 53 of the QA server 5 performs part of speech decomposition on the question message to extract one or a plurality of keywords, It stores in the decomposition keyword storage unit 540 (step S11). If the question message is an enumeration of words, the part of speech may not be decomposed. Then, the DB access unit 51 registers a new record in the QADB 560 and the keyword DB 570 based on the question data and the keyword extracted in Step S11 (Step S13). And it transfers to the process of step S27 mentioned later.

一方、ステップS7においてレコードが抽出されたと判定された場合(ステップS9:Yesルート)、QAサーバ5のDBアクセス部51は、キーワードDB570及びQADB560を参照し、ステップS7において抽出され且つワーク・メモリ領域500の類似記事データ格納部520に格納された記事データ(類似記事データ)のうち、質問メッセージに含まれる少なくとも一部の語句に一致する除外キーワードが対応付けられているものを除いた記事データ(絞込み記事データ)を抽出し、ワーク・メモリ領域500の絞込記事データ格納部530に格納する(ステップS15)。   On the other hand, when it is determined in step S7 that a record has been extracted (step S9: Yes route), the DB access unit 51 of the QA server 5 refers to the keyword DB 570 and the QADB 560, and is extracted in step S7 and has a work memory area. Article data (excluding article data (similar article data) stored in 500 similar article data storage unit 520 except for those associated with excluded keywords that match at least some of the phrases included in the question message ( (Restricted article data) is extracted and stored in the narrowed article data storage unit 530 of the work memory area 500 (step S15).

具体的には、まず、類似記事データ格納部520に格納されている記事データの記事番号を抽出する。そして、キーワードDB570を参照し、抽出した記事番号に該当する(対応記事番号(NO)の列400の値が一致する)レコードの解決しなかったキーワードの列404の値(除外キーワード)が、質問メッセージに含まれる少なくとも一部の語句に一致しないレコードを特定する。そして、特定されたレコードの対応記事番号(NO)の列400の値に基づき、QADB560(又は類似記事データ格納部520)を検索し、該当する(記事番号(NO)の列300の値が一致する)レコード(記事データ)を抽出する。   Specifically, first, the article number of the article data stored in the similar article data storage unit 520 is extracted. Then, referring to the keyword DB 570, the value (excluded keyword) of the unresolved keyword column 404 of the record corresponding to the extracted article number (the value of the corresponding article number (NO) column 400 matches) is Identify records that do not match at least some of the words in the message. Then, based on the value in the column 400 of the corresponding article number (NO) of the specified record, the QADB 560 (or similar article data storage unit 520) is searched, and the values in the column 300 of the corresponding (article number (NO)) match. Yes) to extract records (article data).

そして、Webサーバ部57は、絞込み記事データに基づきQA一覧ページ・データを生成し、ユーザ端末3に送信する(ステップS17)。ユーザ端末3は、QA一覧ページ・データをQAサーバ5から受信し、表示装置に表示する(ステップS19)。   Then, the Web server unit 57 generates QA list page data based on the narrowed-down article data and transmits it to the user terminal 3 (step S17). The user terminal 3 receives the QA list page data from the QA server 5 and displays it on the display device (step S19).

図7に、QA一覧ページの一例(その1)を示す。図7の例には、質問内容表示部700と「はい」ボタン702と「いいえ」ボタン704と類似記事表示部706乃至710と「全類似記事表示」ボタン712とが含まれている。図7の例は、例えば図4に示したキーワードDB570の例において1乃至3行目のレコードが登録されており且つ解決しなかったキーワードの列404に何も登録されていないような場合、及び図3に示したQADB560の例において1乃至3行目のレコードが登録されているような場合について示されている。このような場合、質問内容表示部700に示されているような質問メッセージを受け付けると、類似記事検索用キーワードの列402(図4)に登録されている検索用キーワードが質問メッセージに含まれている記事データ、すなわち、記事番号(NO)135乃至137の記事データが抽出される。そして、各々の記事データが類似記事表示部706乃至710に示される。   FIG. 7 shows an example (part 1) of the QA list page. The example of FIG. 7 includes a question content display section 700, a “Yes” button 702, a “No” button 704, similar article display sections 706 to 710, and a “display all similar articles” button 712. In the example of FIG. 7, for example, in the example of the keyword DB 570 shown in FIG. 4, records in the first to third rows are registered, and nothing is registered in the keyword column 404 that has not been solved, and In the example of the QADB 560 shown in FIG. 3, the case where the records in the first to third rows are registered is shown. In such a case, when a question message as shown in the question content display section 700 is received, the search message registered in the similar article search keyword column 402 (FIG. 4) is included in the question message. Article data, that is, article data of article numbers (NO) 135 to 137 is extracted. Each article data is displayed in similar article display sections 706 to 710.

なお、図7の例では、様々なユーザからの質問に対する回答が示されているが、管理者等が、予め想定される質問及び回答を登録しておくこともできる。そして、ユーザは、類似記事表示部706乃至710に示されたデータを見て、質問が解決した場合には「はい」ボタン702をクリックし、解決しなかった場合には「いいえ」ボタン704をクリックする。本実施の形態においては、回答が示されていない場合であっても、同様の質問の記事があり、回答が得られれば自分の質問も解決するような場合には、「はい」ボタン702をクリックするようにする。また、絞り込まれていない全ての類似記事を閲覧したい場合には「全類似記事表示」ボタン712をクリックする。なお、図7の例は、除外キーワードが登録されていない場合であったため、ページ移行しても提示される記事は変わらない。このような場合には、「全類似記事表示」ボタン712をページに含めないようにしてもよい。   In the example of FIG. 7, answers to questions from various users are shown, but an administrator or the like can register questions and answers that are assumed in advance. Then, the user looks at the data shown in the similar article display sections 706 to 710 and clicks the “Yes” button 702 when the question is solved, and clicks the “No” button 704 when the question is not solved. click. In the present embodiment, even if no answer is shown, if there is an article with the same question and if the answer is obtained, the question is solved, the “Yes” button 702 is clicked. Click. If all similar articles that have not been narrowed down are to be browsed, the “display all similar articles” button 712 is clicked. In addition, since the example of FIG. 7 is a case where no exclusion keyword is registered, the article presented is not changed even when the page is shifted. In such a case, the “display all similar articles” button 712 may not be included in the page.

図8に、QA一覧ページの一例(その2)を示す。ページの構成は図7に示したものと同様であり、質問内容表示部800と「はい」ボタン702と「いいえ」ボタン704と類似記事表示部810と「全類似記事表示」ボタン712とが含まれている。図8の例は、キーワードDB570に図4に示したようなレコードが登録されている場合、及びQADB560に図3に示したようなレコードが登録されている場合について示されている。このような場合、質問内容表示部800に示されているような質問メッセージを受け付けると、類似記事検索用キーワードの列402(図4)に登録されている検索用キーワードが質問メッセージに含まれている記事データ、すなわち、記事番号(NO)135乃至138の記事データが抽出される。さらに、これらの記事データのうち、非解決キーワードの列404(図4)に登録されている除外キーワードが質問メッセージに含まれていない記事データ、すなわち、記事番号(NO)138の記事データが絞込み抽出される。そして、絞込み抽出された記事データが類似記事表示部810に示される。このように、除外キーワードが登録されている場合には、受け付けた質問を解決しないと想定される記事データは提示されないようになる。   FIG. 8 shows an example (part 2) of the QA list page. The page structure is the same as that shown in FIG. 7, and includes a question content display section 800, a “Yes” button 702, a “No” button 704, a similar article display section 810, and a “Display all similar articles” button 712. It is. The example of FIG. 8 shows the case where the record as shown in FIG. 4 is registered in the keyword DB 570 and the case where the record as shown in FIG. 3 is registered in the QADB 560. In such a case, when a question message as shown in the question content display unit 800 is accepted, the search message registered in the similar article search keyword column 402 (FIG. 4) is included in the question message. Article data, that is, article data of article numbers (NO) 135 to 138 is extracted. Further, among these article data, the article data in which the excluded keyword registered in the unresolved keyword column 404 (FIG. 4) is not included in the question message, that is, the article data of the article number (NO) 138 is narrowed down. Extracted. Then, the extracted article data is displayed in the similar article display unit 810. In this way, when the excluded keyword is registered, article data that is assumed not to solve the accepted question is not presented.

図6の説明に戻り、ユーザ端末3は、QA一覧ページに対するユーザからの選択入力を受け付け、選択入力データをQAサーバ5に送信する(図6:ステップS21)。QAサーバ5のWebサーバ部57は、選択入力データをユーザ端末3から受信し、一旦記憶装置に格納する(ステップS23)。そして、Webサーバ部57は、ユーザからの選択入力が「解決した」旨の選択入力であったか判定する(ステップS25)。上でも述べたが、「はい」ボタン702がクリックされていれば「解決した」と判定する。   Returning to the description of FIG. 6, the user terminal 3 accepts a selection input from the user for the QA list page, and transmits the selection input data to the QA server 5 (FIG. 6: Step S21). The Web server unit 57 of the QA server 5 receives the selected input data from the user terminal 3 and temporarily stores it in the storage device (step S23). Then, the Web server unit 57 determines whether or not the selection input from the user is a selection input indicating “solved” (step S25). As described above, if the “yes” button 702 is clicked, it is determined that “solved”.

「解決した」と判定されなかった場合(ステップS25:Noルート)、処理は端子Aを介して図9の処理に移行する。一方、「解決した」と判定された場合(ステップS25:Yesルート)、Webサーバ部57は、当該QAシステムのトップ・ページのデータを生成し、ユーザ端末3に送信する(ステップS27)。ユーザ端末3は、トップ・ページのデータをQAサーバから受信し、表示装置に表示する(ステップS29)。なお、トップ・ページには、図示しないが、質問入力ページへのリンクボタン等を含むQAシステムのメニューが示される。そして、質問受付処理を終了する。以上のようにして、検索用キーワードを用いて抽出された類似記事を除外キーワードを用いて絞込み、適切なQA一覧ページをユーザに提示する。   If it is not determined that the problem has been resolved (step S25: No route), the process proceeds to the process of FIG. On the other hand, if it is determined that the problem has been resolved (step S25: Yes route), the web server unit 57 generates top page data of the QA system and transmits it to the user terminal 3 (step S27). The user terminal 3 receives the top page data from the QA server and displays it on the display device (step S29). Although not shown, the top page shows a menu of the QA system including a link button to a question input page. Then, the question acceptance process ends. As described above, similar articles extracted using the search keyword are narrowed down using the excluded keyword, and an appropriate QA list page is presented to the user.

次に、図9及び図10を用いて、端子Aを介して移行した後の処理について説明する。まず、QAサーバ5のWebサーバ部57は、QA一覧ページに対するユーザからの選択入力が「全類似記事表示」であったか判定する(図9:ステップS41)。上でも述べたが、「全類似記事表示」ボタン712がクリックされていれば「全類似記事表示」であったと判定する。「全類似記事表示」であったと判定された場合(ステップS41:Yesルート)、処理は端子Bを介して図11の処理に移行する。一方、「全類似記事表示」ではなかった(「いいえ」ボタン704がクリックされた)と判定された場合(ステップS41:Noルート)、QAサーバ5の品詞分解部53は、ステップS5においてワーク・メモリ領域500の投稿データ格納部510に格納された質問データに含まれる質問メッセージを品詞分解してキーワードを抽出し、ワーク・メモリ領域500の分解キーワード格納部540に格納する(ステップS43)。   Next, processing after the transition through the terminal A will be described with reference to FIGS. 9 and 10. First, the Web server unit 57 of the QA server 5 determines whether the selection input from the user for the QA list page is “display all similar articles” (FIG. 9: step S41). As described above, if the “display all similar articles” button 712 is clicked, it is determined that “all similar articles are displayed”. If it is determined that “all similar articles are displayed” (step S41: Yes route), the process proceeds to the process of FIG. On the other hand, if it is determined that it is not “display all similar articles” (the “No” button 704 has been clicked) (step S41: No route), the part-of-speech decomposition unit 53 of the QA server 5 performs the work- The question message included in the question data stored in the posted data storage unit 510 of the memory area 500 is decomposed into parts of speech to extract keywords, and stored in the decomposition keyword storage unit 540 of the work memory area 500 (step S43).

例えば質問メッセージのタイトルが「***tyBANKログインパスワードについて」であり、質問文が「ログイン時のIDとパスワードがわかりません。ホームページアドレスも忘れました。教えてください。」であった場合、例えば「***tyBANK」、「ログイン」、「パスワード」、「ID」及び「ホームページアドレス」というキーワードが抽出される。なお、品詞分解方法及びキーワード抽出方法(例えば「わかりません」や「教えてください」はキーワードとして抽出しないようにする)については、従来技術を用いればよく、詳細な説明は省略する。   For example, if the title of the question message is “*** tyBANK login password” and the question is “I don't know the login ID and password. I forgot the homepage address. For example, keywords “*** tyBANK”, “login”, “password”, “ID”, and “homepage address” are extracted. The part-of-speech decomposition method and the keyword extraction method (for example, “I don't know” and “Tell me” are not extracted as keywords) may use conventional techniques and will not be described in detail.

そして、QAサーバ5の非解決キーワード抽出部55は、分解キーワード格納部540に格納されたキーワードのうち、いずれの絞込み記事データにも対応付けられていないキーワードを抽出し、ワーク・メモリ領域500の非解決キーワード格納部550に格納する(ステップS45)。例えば上のように「***tyBANK」、「ログイン」、「パスワード」、「ID」及び「ホームページアドレス」というキーワードが分解キーワード格納部540に格納されており且つ絞込み記事データに対応付けられている検索用キーワードが「***tyBANK」、「ログイン」及び「パスワード」であった場合(例えば図4の1乃至3行目のレコードを参照)、「ID」及び「ホームページアドレス」というキーワードが抽出される。   Then, the unresolved keyword extraction unit 55 of the QA server 5 extracts keywords that are not associated with any narrowed-down article data from the keywords stored in the decomposition keyword storage unit 540, and stores them in the work memory area 500. It stores in the unresolved keyword storage part 550 (step S45). For example, as shown above, the keywords “*** tyBANK”, “login”, “password”, “ID”, and “homepage address” are stored in the decomposition keyword storage unit 540 and associated with the narrowed-down article data. If the search keywords are “*** tyBANK”, “login”, and “password” (see, for example, the records in the first to third lines in FIG. 4), the keywords “ID” and “homepage address” are Extracted.

そして、Webサーバ部57は、非解決キーワード格納部550に格納されたキーワードを用いて「解決しなかったキーワード」確認用ページ・データを生成し、ユーザ端末3に送信する(ステップS47)。ユーザ端末3は、「解決しなかったキーワード」確認用ページ・データをQAサーバ5から受信し、表示装置に表示する(ステップS49)。   Then, the Web server unit 57 generates “unresolved keyword” confirmation page data using the keywords stored in the unresolved keyword storage unit 550, and transmits the page data to the user terminal 3 (step S47). The user terminal 3 receives the “unresolved keyword” confirmation page data from the QA server 5 and displays it on the display device (step S49).

図10に「解決しなかったキーワード」確認用ページの一例を示す。図10の例には、非解決キーワード表示入力欄1000と「はい」ボタン1002と「いいえ」ボタン1004と質問内容表示部1006とが含まれている。非解決キーワード表示入力欄1000には、ステップS45(図9)においてワーク・メモリ領域500の非解決キーワード格納部550に格納されたキーワードが示されている。また、この非解決キーワード表示入力欄1000は、ユーザによるキーワードの追加、更新及び削除を可能としている。例えば図7に示したQA一覧ページからこの非解決キーワード確認ページに移行した場合、非解決キーワード表示入力欄1000に示されている「ID」及び「ホームページアドレス」というキーワードのうち、「ID」については、類似記事表示部706(図7)の回答部分に示されていたので削除するということができる。そして、ユーザは、非解決キーワード表示入力欄1000に示されているキーワード(自分がキーワードを設定し直した場合を含む)を、次回以降の検索処理で用いる除外キーワードとして設定してよい場合には「はい」ボタン1002をクリックし、設定したくない場合には「いいえ」ボタン1004をクリックする。   FIG. 10 shows an example of the “unresolved keyword” confirmation page. The example of FIG. 10 includes an unresolved keyword display input field 1000, a “Yes” button 1002, a “No” button 1004, and a question content display unit 1006. In the unresolved keyword display input field 1000, keywords stored in the unresolved keyword storage unit 550 of the work memory area 500 in step S45 (FIG. 9) are shown. The unresolved keyword display input field 1000 allows the user to add, update, and delete keywords. For example, when the QA list page shown in FIG. 7 is transferred to the unresolved keyword confirmation page, “ID” among the keywords “ID” and “Homepage address” shown in the unresolved keyword display input field 1000 is displayed. Can be said to be deleted because it is shown in the answer portion of the similar article display portion 706 (FIG. 7). When the user can set the keyword (including the case where he / she resets the keyword) shown in the unresolved keyword display input field 1000 as an excluded keyword to be used in the subsequent search processing. A “Yes” button 1002 is clicked, and a “No” button 1004 is clicked when setting is not desired.

図9の説明に戻り、ユーザ端末3は、「解決しなかったキーワード」確認用ページに対するユーザからの入力を受け付け、入力データ(非解決キーワード表示入力欄1000(図10)に示されていた除外キーワードを含む)をQAサーバ5に送信する(図9:ステップ51)。QAサーバ5のWebサーバ部57は、入力データをユーザ端末3から受信し、一旦記憶装置に格納する(ステップS53)。そして、Webサーバ部57は、ユーザからの指示が、除外キーワードを「登録する」旨の指示であったか判定する(ステップS55)。上でも述べたが、「はい」ボタン1002がクリックされていれば「登録する」であったと判定する。   Returning to the description of FIG. 9, the user terminal 3 accepts an input from the user for the “unresolved keyword” confirmation page, and the input data (excluded in the unresolved keyword display input field 1000 (FIG. 10)) (Including keywords) is transmitted to the QA server 5 (FIG. 9: step 51). The Web server unit 57 of the QA server 5 receives the input data from the user terminal 3 and temporarily stores it in the storage device (step S53). Then, the Web server unit 57 determines whether the instruction from the user is an instruction to “register” the excluded keyword (step S55). As described above, if the “Yes” button 1002 is clicked, it is determined that “Register” is selected.

「登録する」ではなかった(「いいえ」ボタン1004がクリックされた)と判定された場合(ステップS55:Noルート)、後に述べるステップS59の処理に移行する。一方、「登録する」であったと判定された場合(ステップS55:Yesルート)、QAサーバ5のDBアクセス部51は、除外キーワードをキーワードDB570に設定登録する(ステップS57)。例えば、非解決キーワード表示入力欄1000(図10)に示されていた除外キーワードが「ホームページアドレス」であり且つQA一覧ページに示されていた記事データの記事番号(NO)が135乃至137であった場合(図7参照)、図4の例の1乃至3行目のレコードに示したように、キーワードDB570の該当するレコード(対応記事番号(NO)が135乃至137)の、解決しなかったキーワードの列404に「ホームページアドレス」という値(除外キーワード)が設定登録される。   If it is determined that it is not “register” (the “No” button 1004 has been clicked) (step S55: No route), the process proceeds to step S59 described later. On the other hand, when it is determined that “register” (step S55: Yes route), the DB access unit 51 of the QA server 5 sets and registers the excluded keyword in the keyword DB 570 (step S57). For example, the excluded keyword shown in the unresolved keyword display input field 1000 (FIG. 10) is “homepage address”, and the article numbers (NO) of article data shown on the QA list page are 135 to 137. (See FIG. 7), as shown in the records in the first to third lines in the example of FIG. 4, the corresponding records in the keyword DB 570 (corresponding article numbers (NO) 135 to 137) were not resolved. A value (excluded keyword) “homepage address” is set and registered in the keyword column 404.

さらに、DBアクセス部51は、投稿データ格納部510に格納されている質問データ及び分解キーワード格納部540に格納されているキーワードを用いて、QADB560及びキーワードDB570に新規レコードを登録する(ステップS59)。そして、処理は端子Cを介してステップS27(図6)の処理に移行する。   Further, the DB access unit 51 registers a new record in the QADB 560 and the keyword DB 570 using the question data stored in the posted data storage unit 510 and the keyword stored in the decomposition keyword storage unit 540 (step S59). . And a process transfers to the process of step S27 (FIG. 6) via the terminal C. FIG.

次に、図11を用いて、端子Bを介して移行した後の処理について説明する。まず、QAサーバ5のWebサーバ部57は、ワーク・メモリ領域500の類似記事データ格納部520に格納されている類似記事データに基づき、QA一覧ページ・データを生成し、ユーザ端末3に送信する(図11:ステップS71)。ユーザ端末3は、QA一覧ページ・データをQAサーバ5から受信し、表示装置に表示する(ステップS73)。ここで表示されるQA一覧ページは、図7や図8に示した例と同様の構成である。但し、絞り込まれていない記事データが示されるため、当該ページには「全類似記事表示」ボタン712は含まれないようになっている。   Next, a process after the transition through the terminal B will be described with reference to FIG. First, the Web server unit 57 of the QA server 5 generates QA list page data based on the similar article data stored in the similar article data storage unit 520 of the work memory area 500 and transmits it to the user terminal 3. (FIG. 11: Step S71). The user terminal 3 receives the QA list page data from the QA server 5 and displays it on the display device (step S73). The QA list page displayed here has the same configuration as the example shown in FIGS. However, since the article data that has not been narrowed down is shown, the page does not include the “display all similar articles” button 712.

そして、ユーザ端末3は、QA一覧ページに対するユーザからの選択入力を受け付け、選択入力データをQAサーバ5に送信する(ステップS75)。QAサーバ5のWebサーバ部57は、選択入力データをユーザ端末3から受信し、一旦記憶装置に格納する(ステップS77)。そして、Webサーバ部57は、ユーザからの選択入力が「解決した」旨の選択入力であったか判定する(ステップS79)。「はい」ボタン702がクリックされていれば「解決した」と判定する。「解決した」と判定された場合(ステップS79:Yesルート)、処理は端子Cを介してステップS27(図6)の処理に移行する。一方、「解決した」と判定されなかった場合(ステップS79:Noルート)、QAサーバ5の品詞分解部53は、ワーク・メモリ領域500の投稿データ格納部510に格納された質問データに含まれている質問メッセージを品詞分解して1又は複数のキーワードを抽出し、ワーク・メモリ領域500の分解キーワード格納部540に格納する(ステップS81)。なお、質問メッセージが単語の羅列等である場合には、品詞分解しない場合もある。   And the user terminal 3 receives the selection input from the user with respect to a QA list page, and transmits selection input data to the QA server 5 (step S75). The Web server unit 57 of the QA server 5 receives the selected input data from the user terminal 3 and temporarily stores it in the storage device (step S77). Then, the Web server unit 57 determines whether or not the selection input from the user is a selection input indicating “Resolved” (Step S79). If the “yes” button 702 is clicked, it is determined that “solved”. If it is determined that the problem has been resolved (step S79: Yes route), the process proceeds to the process of step S27 (FIG. 6) via the terminal C. On the other hand, if it is not determined as “solved” (step S79: No route), the part of speech decomposition unit 53 of the QA server 5 is included in the question data stored in the posted data storage unit 510 of the work memory area 500. The question message is decomposed to extract one or more keywords and stored in the decomposition keyword storage unit 540 of the work memory area 500 (step S81). If the question message is an enumeration of words, the part of speech may not be decomposed.

そして、QAサーバ5の非解決キーワード抽出部55は、分解キーワード格納部540に格納されたキーワードのうち、いずれの類似記事データにも対応付けられていないキーワードを抽出し、ワーク・メモリ領域500の非解決キーワード格納部550に格納する(ステップS83)。この処理は、上で述べたステップS45(図9)の処理と同様であるが、ここでは絞込み記事データではなく類似記事データを参照する。そして、処理は端子Dを介してステップS47の処理に移行する。   Then, the unresolved keyword extraction unit 55 of the QA server 5 extracts keywords that are not associated with any similar article data from the keywords stored in the decomposition keyword storage unit 540, and stores them in the work memory area 500. It stores in the unresolved keyword storage part 550 (step S83). This process is the same as the process in step S45 (FIG. 9) described above, but here, similar article data is referred to instead of narrowed article data. And a process transfers to the process of step S47 via the terminal D. FIG.

以上、図9乃至図11を用いて説明したようにして、QA一覧ページに示された記事データに除外キーワードが対応付けられる。   As described above with reference to FIGS. 9 to 11, the exclusion keyword is associated with the article data shown on the QA list page.

このようにして、除外キーワードを用いることによる適切な類似記事データの提示、及び除外キーワードの設定登録が行われる。   In this way, appropriate similar article data is presented by using the excluded keyword, and setting and registration of the excluded keyword are performed.

なお、メール・データ生成及び送信機能を有するWebサーバ部57は、ステップS13(図6)又はステップS59(図9)の処理によってQADB560(及びキーワードDB570)に新規レコード(質問データ)が登録されたことを検知すると、担当者DB580を参照して、当該質問の種別に対応付けられた担当者又は担当部署のメールアドレスを特定し、特定したメールアドレス宛に、回答用ページのURL(Uniform Resource Locator)を含む回答依頼メール・データを送信する。回答依頼メールを見た担当者又は担当部署のメンバーは、例えば担当者端末7を操作して、回答用ページのURLに基づきQAサーバ5にアクセスし、回答用ページに対して回答を入力する。そして、入力された回答は、QAサーバ5のDBアクセス部51によってQADB560に設定登録される。   In the Web server unit 57 having the mail data generation and transmission function, a new record (question data) is registered in the QADB 560 (and the keyword DB 570) by the process of step S13 (FIG. 6) or step S59 (FIG. 9). When this is detected, the person in charge or the department in charge associated with the question type is identified with reference to the person in charge DB 580, and the URL (Uniform Resource Locator) of the answer page is addressed to the identified mail address. Send response request mail data including). The person in charge or the member of the department in charge who sees the reply request mail operates the person-in-charge terminal 7, for example, accesses the QA server 5 based on the URL of the answer page, and inputs the answer to the answer page. The input answer is set and registered in the QADB 560 by the DB access unit 51 of the QA server 5.

以上本発明の一実施の形態について説明したが、本発明はこれに限定されるものではない。例えば、図3乃至図5に示したテーブル構成は一例であって、同様のデータを格納するためであれば別の構成を採用するようにしてもよいし、必要に応じて項目を追加又は削除してもよい。また、図1に示したQAサーバ5の機能ブロック構成は一例であって、実際のプログラム・モジュール構成とは異なる場合がある。また、各装置が複数のサーバやコンピュータによって構成されていてもよい。また、図2に示したコンピュータの機能ブロック図も一例であって、実際のハードウェア構成とは異なる場合もある。また、図7、図8、図10に示した画面例は一例であって、同様のデータを別の態様で表現する場合もある。さらに、図6、図9及び図11に示した処理フローも一例であって、同様の処理結果が得られる範囲において処理の順序を入れ替えてもよいし、必要に応じてステップを追加又は削除してもよい。   Although one embodiment of the present invention has been described above, the present invention is not limited to this. For example, the table configurations shown in FIGS. 3 to 5 are merely examples, and other configurations may be adopted for storing similar data, and items are added or deleted as necessary. May be. The functional block configuration of the QA server 5 shown in FIG. 1 is merely an example, and may differ from the actual program / module configuration. Each device may be configured by a plurality of servers and computers. The functional block diagram of the computer shown in FIG. 2 is also an example, and may be different from the actual hardware configuration. In addition, the screen examples shown in FIGS. 7, 8, and 10 are examples, and the same data may be expressed in different modes. Furthermore, the processing flows shown in FIGS. 6, 9, and 11 are also examples, and the processing order may be changed within a range in which similar processing results can be obtained, and steps may be added or deleted as necessary. May be.

なお、QAシステムに適用した例を用いて実施の形態を説明したが、必ずしも質問と回答から構成される記事データを取り扱う必要はなく、例えば電子掲示板の類似記事の検索や、キーワードの羅列(AND条件)によるホームページの検索等、本発明に係る技術を他の様々な検索システムに応用することも可能である。   Although the embodiment has been described by using an example applied to the QA system, it is not always necessary to handle article data composed of questions and answers. For example, searching for similar articles on an electronic bulletin board or enumeration of keywords (AND It is also possible to apply the technology according to the present invention to various other search systems, such as a homepage search according to (conditions).

(付記1)
検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納するステップと、
所定のアルゴリズムを用いて、前記メッセージ・データ格納部に格納された前記メッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納する記事データ抽出ステップと、
所定の条件が満たされた場合、前記メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、前記抽出記事データ格納部に格納された前記記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納するステップと、
前記非解決キーワード格納部に格納された前記キーワード候補又はユーザから指定された語句を、除外キーワードとして前記抽出記事データ格納部に格納された前記記事データに対応付けて前記記事データ格納部に更新登録するステップと、
を含み、コンピュータにより実行される類似記事抽出方法。
(Appendix 1)
When message data as a search condition is received, storing in the message data storage unit;
Article data extraction step for extracting article data corresponding to the message data stored in the message data storage unit from the article data storage unit using a predetermined algorithm and storing it in the extracted article data storage unit;
When a predetermined condition is satisfied, among the keyword candidates included in the message data stored in the message data storage unit, the keyword data is associated with the article data stored in the extracted article data storage unit in advance. Extracting a keyword candidate different from the search keyword and storing it in the unresolved keyword storage unit;
The keyword candidate or the phrase specified by the user stored in the unresolved keyword storage unit is associated with the article data stored in the extracted article data storage unit as an excluded keyword and updated and registered in the article data storage unit And steps to
And a similar article extraction method executed by a computer.

(付記2)
前記所定のアルゴリズムが、前記メッセージ・データに含まれる、少なくとも一部の語句に一致する検索用キーワードが対応付けられている第1記事データの抽出、及び抽出された当該第1記事データのうち、前記メッセージ・データに含まれる、少なくとも一部の語句に一致する除外キーワードが対応付けられている記事データを除いた第2記事データを抽出するためのアルゴリズムであることを特徴とする付記1記載の類似記事抽出方法。
(Appendix 2)
Among the extracted first article data, the predetermined algorithm includes extraction of first article data associated with search keywords that match at least some of the phrases included in the message data, and The algorithm for extracting second article data excluding article data associated with an exclusion keyword that matches at least a part of words included in the message data, according to claim 1 Similar article extraction method.

(付記3)
前記第2記事データの内容をユーザが確認するためのデータを生成し、出力するステップと、
前記第2記事データの内容を確認した前記ユーザからの要求に従って、前記第1記事データの内容を前記ユーザが確認するためのデータを生成し、出力するステップと、
をさらに含む付記2記載の類似記事抽出方法。
(Appendix 3)
Generating and outputting data for the user to confirm the content of the second article data;
Generating and outputting data for the user to confirm the content of the first article data in accordance with a request from the user who has confirmed the content of the second article data;
The similar article extraction method according to supplementary note 2, further including:

(付記4)
前記所定の条件が、前記抽出記事データ格納部に格納された前記記事データの内容が不十分であるというユーザからの指示を検知することであることを特徴とする付記1乃至3のいずれか1つに記載の類似記事抽出方法。
(Appendix 4)
Any one of Supplementary notes 1 to 3, wherein the predetermined condition is to detect an instruction from a user that the content of the article data stored in the extracted article data storage unit is insufficient. The similar article extraction method described in 1.

(付記5)
前記抽出記事データ格納部に格納された前記記事データの内容が十分であるというユーザからの指示を検知した場合、前記メッセージ・データ格納部に格納された前記メッセージ・データを破棄するステップをさらに含む付記1乃至4のいずれか1つに記載の類似記事抽出方法。
(Appendix 5)
A step of discarding the message data stored in the message data storage unit when detecting an instruction from the user that the content of the article data stored in the extracted article data storage unit is sufficient; The similar article extraction method according to any one of appendices 1 to 4.

(付記6)
前記記事データ抽出ステップが、前記メッセージ・データに対応する記事データが存在しない場合、前記メッセージ・データと前記メッセージ・データに含まれるキーワードとを、新規の記事データと当該新規の記事データに対応付けられた検索用キーワードとして前記記事データ格納部に格納するステップを含む付記1乃至5のいずれか1つに記載の類似記事抽出方法。
(Appendix 6)
When the article data extraction step does not include article data corresponding to the message data, the message data and a keyword included in the message data are associated with the new article data and the new article data. The similar article extraction method according to any one of appendices 1 to 5, including a step of storing the retrieved keyword as a search keyword in the article data storage unit.

(付記7)
前記非解決キーワード格納部に格納された前記キーワード候補の確認及び語句の指定をユーザに促すためのデータを生成し、出力するステップと、
をさらに含む付記1乃至6のいずれか1つに記載の類似記事抽出方法。
(Appendix 7)
Generating and outputting data for prompting a user to confirm the keyword candidate and specify a phrase stored in the unresolved keyword storage unit;
The similar article extraction method according to any one of supplementary notes 1 to 6, further including:

(付記8)
検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納するステップと、
所定のアルゴリズムを用いて、前記メッセージ・データ格納部に格納された前記メッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納するステップと、
所定の条件が満たされた場合、前記メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、前記抽出記事データ格納部に格納された前記記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納するステップと、
前記非解決キーワード格納部に格納された前記キーワード候補又はユーザから指定された語句を、除外キーワードとして前記抽出記事データ格納部に格納された前記記事データに対応付けて前記記事データ格納部に更新登録するステップと、
をコンピュータに実行させる類似記事抽出プログラム。
(Appendix 8)
When message data as a search condition is received, storing in the message data storage unit;
Using a predetermined algorithm, extracting the article data corresponding to the message data stored in the message data storage unit from the article data storage unit, and storing it in the extracted article data storage unit;
When a predetermined condition is satisfied, among the keyword candidates included in the message data stored in the message data storage unit, the keyword data is associated with the article data stored in the extracted article data storage unit in advance. Extracting a keyword candidate different from the search keyword and storing it in the unresolved keyword storage unit;
The keyword candidate or the phrase specified by the user stored in the unresolved keyword storage unit is associated with the article data stored in the extracted article data storage unit as an excluded keyword and updated and registered in the article data storage unit And steps to
A similar article extraction program that runs a computer.

(付記9)
検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納する手段と、
所定のアルゴリズムを用いて、前記メッセージ・データ格納部に格納された前記メッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納する手段と、
所定の条件が満たされた場合、前記メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、前記抽出記事データ格納部に格納された前記記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納する手段と、
前記非解決キーワード格納部に格納された前記キーワード候補又はユーザから指定された語句を、除外キーワードとして前記抽出記事データ格納部に格納された前記記事データに対応付けて前記記事データ格納部に更新登録する手段と、
を有する類似記事抽出装置。
(Appendix 9)
When message data as a search condition is received, means for storing in the message data storage unit;
Means for extracting the article data corresponding to the message data stored in the message data storage unit from the article data storage unit using a predetermined algorithm and storing it in the extracted article data storage unit;
When a predetermined condition is satisfied, among the keyword candidates included in the message data stored in the message data storage unit, the keyword data is associated with the article data stored in the extracted article data storage unit in advance. Means for extracting keyword candidates different from the search keyword and storing them in the unresolved keyword storage unit
The keyword candidate or the phrase specified by the user stored in the unresolved keyword storage unit is associated with the article data stored in the extracted article data storage unit as an excluded keyword and updated and registered in the article data storage unit Means to
A similar article extraction device.

本発明の一実施の形態におけるシステム構成図である。1 is a system configuration diagram according to an embodiment of the present invention. 本発明の実施の形態におけるコンピュータの機能ブロックの概要を示す図である。It is a figure which shows the outline | summary of the functional block of the computer in embodiment of this invention. QADBテーブルの一例を示す図である。It is a figure which shows an example of a QADB table. キーワードDBテーブルの一例を示す図である。It is a figure which shows an example of a keyword DB table. 担当者DBテーブルの一例を示す図である。It is a figure which shows an example of a person in charge DB table. 本発明の一実施の形態における処理フロー(その1)を示す図である。It is a figure which shows the processing flow (the 1) in one embodiment of this invention. QA一覧ページの一例(その1)を示す図である。It is a figure which shows an example (the 1) of a QA list page. QA一覧ページの一例(その2)を示す図である。It is a figure which shows an example (the 2) of a QA list page. 本発明の一実施の形態における処理フロー(その2)を示す図である。It is a figure which shows the processing flow (the 2) in one embodiment of this invention. 非解決キーワード確認ページの一例を示す図である。It is a figure which shows an example of an unresolved keyword confirmation page. 本発明の一実施の形態における処理フロー(その3)を示す図である。It is a figure which shows the processing flow (the 3) in one embodiment of this invention.

符号の説明Explanation of symbols

1 ネットワーク 3 ユーザ端末 5 QAサーバ
7 担当者端末 9 管理者端末
51 DBアクセス部 53 品詞分解部
55 非解決キーワード抽出部 57 Webサーバ部
500 ワーク・メモリ領域 510 投稿データ格納部
520 類似記事データ格納部
530 絞込記事データ格納部
540 分解キーワード格納部
550 非解決キーワード格納部
560 QADB 570 キーワードDB
580 担当者DB
DESCRIPTION OF SYMBOLS 1 Network 3 User terminal 5 QA server 7 Person in charge terminal 9 Manager terminal 51 DB access part 53 Part of speech decomposition part 55 Unresolved keyword extraction part 57 Web server part 500 Work memory area 510 Posted data storage part 520 Similar article data storage part 530 Narrowed article data storage unit 540 Decomposition keyword storage unit 550 Unsolved keyword storage unit 560 QADB 570 Keyword DB
580 Person in charge DB

Claims (5)

検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納するステップと、
所定のアルゴリズムを用いて、前記メッセージ・データ格納部に格納された前記メッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納するステップと、
所定の条件が満たされた場合、前記メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、前記抽出記事データ格納部に格納された前記記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納するステップと、
前記非解決キーワード格納部に格納された前記キーワード候補又はユーザから指定された語句を、除外キーワードとして前記抽出記事データ格納部に格納された前記記事データに対応付けて前記記事データ格納部に更新登録するステップと、
を含み、コンピュータにより実行される類似記事抽出方法。
When message data as a search condition is received, storing in the message data storage unit;
Using a predetermined algorithm, extracting the article data corresponding to the message data stored in the message data storage unit from the article data storage unit, and storing it in the extracted article data storage unit;
When a predetermined condition is satisfied, among the keyword candidates included in the message data stored in the message data storage unit, the keyword data is associated with the article data stored in the extracted article data storage unit in advance. Extracting a keyword candidate different from the search keyword and storing it in the unresolved keyword storage unit;
The keyword candidate or the phrase specified by the user stored in the unresolved keyword storage unit is associated with the article data stored in the extracted article data storage unit as an excluded keyword and updated and registered in the article data storage unit And steps to
And a similar article extraction method executed by a computer.
前記所定のアルゴリズムが、前記メッセージ・データに含まれる、少なくとも一部の語句に一致する検索用キーワードが対応付けられている第1記事データの抽出、及び抽出された当該第1記事データのうち、前記メッセージ・データに含まれる、少なくとも一部の語句に一致する除外キーワードが対応付けられている記事データを除いた第2記事データを抽出するためのアルゴリズムであることを特徴とする請求項1記載の類似記事抽出方法。   Among the extracted first article data, the predetermined algorithm includes extraction of first article data associated with search keywords that match at least some of the phrases included in the message data, and 2. The algorithm for extracting second article data excluding article data associated with excluded keywords that match at least some of the words included in the message data. Similar article extraction method. 前記第2記事データの内容をユーザが確認するためのデータを生成し、出力するステップと、
前記第2記事データの内容を確認した前記ユーザからの要求に従って、前記第1記事データの内容を前記ユーザが確認するためのデータを生成し、出力するステップと、
をさらに含む請求項2記載の類似記事抽出方法。
Generating and outputting data for the user to confirm the content of the second article data;
Generating and outputting data for the user to confirm the content of the first article data in accordance with a request from the user who has confirmed the content of the second article data;
The similar article extraction method according to claim 2, further comprising:
前記所定の条件が、前記抽出記事データ格納部に格納された前記記事データの内容が不十分であるというユーザからの指示を検知することであることを特徴とする請求項1乃至3のいずれか1つに記載の類似記事抽出方法。   4. The predetermined condition is to detect an instruction from a user that the content of the article data stored in the extracted article data storage unit is insufficient. The similar article extraction method according to one. 検索条件としてのメッセージ・データを受信した場合、メッセージ・データ格納部に格納するステップと、
所定のアルゴリズムを用いて、前記メッセージ・データ格納部に格納された前記メッセージ・データに対応する記事データを記事データ格納部から抽出し、抽出記事データ格納部に格納するステップと、
所定の条件が満たされた場合、前記メッセージ・データ格納部に格納されているメッセージ・データに含まれるキーワード候補のうち、前記抽出記事データ格納部に格納された前記記事データに予め対応付けられている検索用キーワードと異なるキーワード候補を抽出し、非解決キーワード格納部に格納するステップと、
前記非解決キーワード格納部に格納された前記キーワード候補又はユーザから指定された語句を、除外キーワードとして前記抽出記事データ格納部に格納された前記記事データに対応付けて前記記事データ格納部に更新登録するステップと、
をコンピュータに実行させる類似記事抽出プログラム。
When message data as a search condition is received, storing in the message data storage unit;
Using a predetermined algorithm, extracting the article data corresponding to the message data stored in the message data storage unit from the article data storage unit, and storing it in the extracted article data storage unit;
When a predetermined condition is satisfied, among the keyword candidates included in the message data stored in the message data storage unit, the keyword data is associated with the article data stored in the extracted article data storage unit in advance. Extracting a keyword candidate different from the search keyword and storing it in the unresolved keyword storage unit;
The keyword candidate or the phrase specified by the user stored in the unresolved keyword storage unit is associated with the article data stored in the extracted article data storage unit as an excluded keyword and updated and registered in the article data storage unit And steps to
A similar article extraction program that runs a computer.
JP2003392275A 2003-11-21 2003-11-21 Similar article extracting method and program Pending JP2005157547A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003392275A JP2005157547A (en) 2003-11-21 2003-11-21 Similar article extracting method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003392275A JP2005157547A (en) 2003-11-21 2003-11-21 Similar article extracting method and program

Publications (1)

Publication Number Publication Date
JP2005157547A true JP2005157547A (en) 2005-06-16

Family

ID=34719027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003392275A Pending JP2005157547A (en) 2003-11-21 2003-11-21 Similar article extracting method and program

Country Status (1)

Country Link
JP (1) JP2005157547A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008100690A1 (en) * 2007-02-16 2008-08-21 Microsoft Corporation Context-sensitive searches and functionality for instant messaging applications
JP2008234069A (en) * 2007-03-16 2008-10-02 Fujitsu Ltd Electronic bulletin board control program, device therefor and control method thereof
CN104657346A (en) * 2015-01-15 2015-05-27 深圳市前海安测信息技术有限公司 Question matching system and question matching system in intelligent interaction system
JP2020154681A (en) * 2019-03-20 2020-09-24 株式会社Lifull Feature for preventing duplicate posting during online brainstorming

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008100690A1 (en) * 2007-02-16 2008-08-21 Microsoft Corporation Context-sensitive searches and functionality for instant messaging applications
AU2008216571B2 (en) * 2007-02-16 2012-02-16 Microsoft Technology Licensing, Llc Context-sensitive searches and functionality for instant messaging applications
JP2008234069A (en) * 2007-03-16 2008-10-02 Fujitsu Ltd Electronic bulletin board control program, device therefor and control method thereof
CN104657346A (en) * 2015-01-15 2015-05-27 深圳市前海安测信息技术有限公司 Question matching system and question matching system in intelligent interaction system
JP2020154681A (en) * 2019-03-20 2020-09-24 株式会社Lifull Feature for preventing duplicate posting during online brainstorming

Similar Documents

Publication Publication Date Title
US7752218B1 (en) Method and apparatus for providing comprehensive search results in response to user queries entered over a computer network
US8412517B2 (en) Dictionary word and phrase determination
US7827165B2 (en) Providing a social network aware input dictionary
JP5647508B2 (en) System and method for identifying short text communication topics
JP4936028B2 (en) Information providing support device and information providing support method
US20070208732A1 (en) Telephonic information retrieval systems and methods
US20070078814A1 (en) Novel information retrieval systems and methods
US20060078862A1 (en) Answer support system, answer support apparatus, and answer support program
US20070192309A1 (en) Method and system for identifying sentence boundaries
US7917508B1 (en) Image repository for human interaction proofs
US20090077180A1 (en) Novel systems and methods for transmitting syntactically accurate messages over a network
US9613093B2 (en) Using question answering (QA) systems to identify answers and evidence of different medium types
WO2002010982A2 (en) Computer system for collecting information from web sites
JP2005293239A (en) Information sharing device, and information sharing method
CA2602900A1 (en) Multi-fielded web browser-based searching of data stored in database
US20100169352A1 (en) Novel systems and methods for transmitting syntactically accurate messages over a network
US20140164296A1 (en) Chatbot system and method with entity-relevant content from entity
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
US20050038797A1 (en) Information processing and database searching
JPH0997287A (en) Problem solving support system and method
CN112966081A (en) Method, device, equipment and storage medium for processing question and answer information
JP2008129692A (en) Answer support device, answer support system, answer support method and answer support program
US10853430B1 (en) Automated agent search engine
JP2005157547A (en) Similar article extracting method and program
US20180293508A1 (en) Training question dataset generation from query data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090707