JP2023006482A - 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体 - Google Patents

投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP2023006482A
JP2023006482A JP2021109101A JP2021109101A JP2023006482A JP 2023006482 A JP2023006482 A JP 2023006482A JP 2021109101 A JP2021109101 A JP 2021109101A JP 2021109101 A JP2021109101 A JP 2021109101A JP 2023006482 A JP2023006482 A JP 2023006482A
Authority
JP
Japan
Prior art keywords
posted
post
related term
posted information
word set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021109101A
Other languages
English (en)
Inventor
健介 横田
Kensuke Yokota
秀浩 田代
Hidehiro Tashiro
郁子 中川
Ikuko Nakagawa
尋輝 柳澤
Hiroaki Yanagisawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2021109101A priority Critical patent/JP2023006482A/ja
Publication of JP2023006482A publication Critical patent/JP2023006482A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが投稿した情報について、時系列に基づいて用語の関連性を記録する投稿関連用語生成装置、端末、システム装置及び方法を提供する。【解決手段】投稿関連用語生成システム装置100において、投稿関連用語生成装置10は、ユーザの投稿情報を取得する投稿情報取得部、投稿情報を解析し、投稿情報が含む投稿用語を抽出する投稿情報解析部、投稿情報と、投稿情報が含む投稿用語とを、時系列毎に記憶する投稿情報記憶部、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成するワードセット生成部、ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定する関連度判定部及びユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されていない場合、ワードセットが含む投稿用語の組み合わせを、関連用語として出力する出力部を含む。【選択図】図1

Description

本発明は、投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体に関する。
ユーザが投稿した検索クエリに基づいてコンテンツを検索し、ユーザに提示する技術が知られている(例えば、特許文献1)。
特開2014-228971号公報
しかしながら、ユーザの投稿に基づいて情報を提案する場合、ユーザが指定した用語の範囲の情報のみが検索されるため、提案される情報の幅が狭いという課題がある。
本発明者らは、用語が含む意味同士の関連性が薄い場合にも、連続して投稿される用語については、一定の関連性を有する場合があることを見出した。しかしながら、特許文献1のように、ユーザの投稿に基づいて情報を提案する場合には、このような関連性は考慮されない。
そこで、本発明は、ユーザが投稿した情報について、時系列に基づいて用語の関連性を記録できる投稿関連用語生成装置を提供することを目的とする。
前記目的を達成するために、本発明の投稿関連用語生成装置は、投稿情報取得部、投稿情報解析部、投稿情報記憶部、ワードセット生成部、関連度判定部、及び出力部を含み、
前記投稿情報取得部は、ユーザの投稿情報を取得し、
前記投稿情報解析部は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
前記投稿情報記憶部は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
前記ワードセット生成部は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
前記関連度判定部は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定し、
前記出力部は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する。
本発明の投稿関連用語生成端末は、入力部及び通信部を含み、
前記入力部は、前記投稿情報を入力可能であり、
前記通信部は、前記本発明の投稿関連用語生成装置と通信可能であり、前記投稿情報を前記投稿関連用語生成装置に送信可能である。
本発明の投稿関連用語生成システム装置は、サーバと、端末とを含み、
前記サーバと、前記端末とは、互いに通信可能であり、
前記サーバが、前記本発明の投稿関連用語生成装置であり、
前記端末が、前記本発明の投稿関連用語生成端末である。
本発明の対話装置は、通信部を含み、
前記通信部は、前記本発明の投稿関連用語生成装置と通信可能である。
本発明の投稿関連用語生成方法は、投稿情報取得工程、投稿情報解析工程、投稿情報記憶工程、ワードセット生成工程、関連度判定工程、及び出力工程を含み、
前記投稿情報取得工程は、ユーザの投稿情報を取得し、
前記投稿情報解析工程は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
前記投稿情報記憶工程は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
前記ワードセット生成工程は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
前記関連度判定工程は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定し、
前記出力工程は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する。
本発明のプログラムは、コンピュータに、投稿情報取得手順、投稿情報解析手順、投稿情報記憶手順、ワードセット生成手順、関連度判定手順、及び出力手順を実行させるためのプログラムであって、
前記投稿情報取得手順は、ユーザの投稿情報を取得し、
前記投稿情報解析手順は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
前記投稿情報記憶手順は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
前記ワードセット生成手順は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
前記関連度判定手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語として記憶されているかを判定し、
前記出力手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する。
本発明の記録媒体は、前記本発明のプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
本発明によれば、ユーザが投稿した情報について、時系列に基づいて用語の関連性を記録できる。
図1は、実施形態1の投稿関連用語生成装置を含む投稿関連用語生成システムの一例の構成を示すブロック図である。 図2は、実施形態1の投稿関連用語生成装置のハードウェア構成の一例を示すブロック図である。 図3は、実施形態1の投稿関連用語生成端末のハードウェア構成の一例を示すブロック図である。 図4は、実施形態1の投稿関連用語生成装置における処理の一例を示すフローチャートである。 図5は、実施形態2の投稿関連用語生成装置を含む投稿関連用語生成システムの一例の構成を示すブロック図である。 図6は、実施形態2の投稿関連用語生成装置における処理の一例を示すフローチャートである。
本発明の投稿関連用語生成装置は、例えば、関連度記録部を含み、
前記関連度記録部は、前記関連度判定部により、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていると判定された場合、前記関連用語の関連スコアを加点し、
前記出力部は、前記関連用語と、前記関連スコアとを紐づけて出力する、という態様であってもよい。
本発明の投稿関連用語生成方法は、例えば、関連度記録工程を含み、
前記関連度記録工程は、前記関連用語に関連スコアを紐づけて記録し、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されている場合、前記関連用語に紐づけられた関連スコアを加点し、
前記出力工程は、前記関連用語と、前記関連スコアとを紐づけて出力する、という態様であってもよい。
本発明のプログラムは、例えば、コンピュータに、さらに関連度記録手順を実行させ、
前記関連度記録手順は、前記関連用語に関連スコアを紐づけて記録し、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されている場合、前記関連用語に紐づけられた関連スコアを加点し、
前記出力手順は、前記関連用語と、前記関連スコアとを紐づけて出力する、という態様であってもよい。
次に、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
[実施形態1]
本実施形態は、本発明の投稿関連用語生成装置と、投稿関連用語生成端末とを含む投稿関連用語生成システム装置の例である。
本実施形態の投稿関連用語生成システム装置について、図1を用いて説明する。図1は、本実施形態の投稿関連用語生成装置10、投稿関連用語生成端末20を含む投稿関連用語生成システム装置100の一例の構成を示すブロック図である。図示していないが、投稿関連用語生成システム装置100は、例えば、複数の投稿関連用語生成端末20を含んでもよい。図1に示すように、投稿関連用語生成装置10は、通信回線網30を介して、投稿関連用語生成端末20と接続可能である。投稿関連用語生成装置10は、通信回線網30を介して、装置外のデータベース(外部DB)40と接続可能であってもよい。外部DB40は、例えば、関連用語記憶部である。また、図示していないが、投稿関連用語生成装置10は、例えば、通信回線網30を介して、システム管理者の外部端末とも接続可能であり、システム管理者は、前記外部端末から投稿関連用語生成装置10の管理を実施してもよい。
本実施形態の投稿関連用語生成装置について、図1を用いて説明する。図1に示すように、投稿関連用語生成装置10(以下、「本装置10」ともいう)は、投稿情報取得部11、投稿情報解析部12、投稿情報記憶部13、ワードセット生成部14、関連度判定部15、及び出力部16を含む。
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。この場合、例えば、投稿情報記憶部13は、外部のデータベース40であってもよい。また、本装置10は、通信回線網30を介して、後述する外部装置と接続可能である。通信回線網30は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網30は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
投稿関連用語生成端末20(以下、「端末20」ともいう)は、例えば、PC;携帯電話、スマートフォン、タブレット端末等の携帯端末;スマートウォッチ、スマートグラス、ウェアラブル端末等があげられる。投稿関連用語生成端末20は、例えば、カメラ、スキャナ等の撮像手段、IC(integrated circuit)カードリーダ、マイク等の音声入力手段等を備えてもよい。投稿関連用語生成端末20は、例えば、ユーザの端末である。
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、表示装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
中央処理装置101は、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、投稿情報取得部11、投稿情報解析部12、投稿情報記憶部13、ワードセット生成部14、関連度判定部15、及び出力部16として機能する。
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、外部記憶装置(外部データベース等)、プリンター、外部入力装置、外部表示装置、外部撮像装置、後述する本発明の対話装置等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。記憶装置104は、例えば、投稿情報記憶部13として機能する。また、記憶装置104は、例えば、関連用語記憶部として機能してもよい。
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース40又は外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
本装置10は、例えば、さらに、入力装置105、ディスプレイ106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。ディスプレイ106は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置があげられる。本実施形態1において、入力装置105とディスプレイ106とは、別個に構成されているが、入力装置105とディスプレイ106とは、タッチパネルディスプレイのように、一体として構成されてもよい。
図3に、投稿関連用語生成端末20のハードウェア構成のブロック図を例示する。図3に示すように、投稿関連用語生成端末20は、例えば、CPU201、メモリ202、バス203、記憶装置204、入力装置(入力部)21、通信デバイス(通信部)22、ディスプレイ(表示部)23等を備える。投稿関連用語生成端末20の各部は、それぞれのインタフェース(I/F)により、バス203を介して接続されている。投稿関連用語生成端末20の各構成の説明は、投稿関連用語生成装置10の各構成の説明を援用できる。
つぎに、本実施形態の投稿関連用語生成方法の一例を、図4のフローチャートに基づき説明する。本実施形態の投稿関連用語生成方法は、例えば、図1の投稿関連用語生成システム装置100を用いて、次のように実施する。なお、本実施形態の投稿関連用語生成方法は、図1の投稿関連用語生成システム装置100の使用には限定されない。図4は、投稿関連用語生成システム装置100の処理(S1~S6)の一例を示すフローチャートである。
まず、投稿関連用語生成装置10による処理に先立ち、ユーザが、投稿関連用語生成端末20の入力部21により、ユーザの投稿情報を入力する。そして、投稿関連用語生成端末20は、通信部22により、通信回線網30を介して、前記投稿情報を投稿関連用語生成装置10に送信する。前記投稿情報は、特に制限されず、例えば、テキスト情報でもよいし、音声情報でもよい。前記投稿情報が音声情報である場合、例えば、公知の音声認識システムを用いて、前記音声情報からテキスト情報を生成し、生成したテキストを前記投稿情報として、投稿関連用語生成装置10に送信することができる。前記投稿情報は、例えば、さらに、投稿したユーザの識別情報、ユーザが投稿情報を投稿した日時の情報、ユーザの投稿回数の情報等のその他の情報を含んでもよい。以下の説明においては、前記ユーザが、前記投稿情報として、下記投稿1~投稿5に示すテキスト情報を、投稿1~投稿5の順に投稿した場合を例にあげて説明する。
投稿1「今日は暑いなあ」
投稿2「こんな日はビールでも飲んでパーっとやりたい」
投稿3「ビールと言えば駅前のスーパーAの惣菜がつまみに最高だった」
投稿4「今日は外回りで汗かいたから温泉に入ってこようかな」
投稿5「駅前に新しくできた風呂屋にはサウナがあったな」
つぎに、投稿情報取得部11により、前記ユーザの投稿情報を取得する(S1、投稿情報取得工程)。前記投稿情報の取得は、例えば、通信回線網30を介して取得できる。
つぎに、投稿情報解析部12により、前記ユーザの投稿情報を解析して投稿用語を抽出する(S2、投稿情報解析工程)。投稿情報解析部12による処理は、例えば、公知の自然言語処理手段により実施でき、例えば、形態素解析、構文解析、意味解析、文脈解析照応解析、談話解析等があげられる。投稿情報解析部12による処理について、表1を用いて具体的に説明する。表1に示すように、例えば、S1において、ユーザの投稿1として「今日は暑いなあ」という投稿情報を取得すると、投稿情報解析部12は、前記投稿情報から、「今日」、「暑い」等の投稿用語を抽出する。投稿情報解析部12は、同様にして、投稿2「こんな日はビールでも飲んでパーっとやりたい」からは、「ビール」、「飲んで」、「パーっと」、投稿3「ビールと言えば駅前のスーパーAの惣菜がつまみに最高だった」からは、「ビール」、「駅前」、「スーパーA」、「惣菜」、「つまみ」、「最高」、投稿4「今日は外回りで汗かいたから温泉に入ってこようかな」からは、「今日」、「外回り」、「汗」、「温泉」、投稿5「駅前に新しくできた風呂屋にはサウナがあったな」からは、「駅前」、「新しく」、「風呂屋」、「サウナ」等の投稿用語を抽出する。抽出した投稿用語が複数ある場合、例えば、前記複数の投稿用語について、前記投稿情報に対応する投稿用語群として抽出してもよい。
Figure 2023006482000002
つぎに、投稿情報記憶部13により、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶する(S3、投稿情報記憶工程)。前記「時系列毎に記憶」とは、例えば、前記ユーザの投稿情報と、ユーザが前記投稿情報を投稿した日時の情報とを紐づけて記憶することでもよいし、前記ユーザの投稿情報と、ユーザの投稿回数の情報(例えば、最新の情報(n回目の投稿)からn-1回前の投稿、等の情報)とを紐づけて記憶することでもよい。後者の場合、投稿情報記憶部13は、例えば、n回目の投稿から数えてn-5回目以前の投稿情報については、記憶せず削除してもよい。
つぎに、ワードセット生成部14により、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成する(S4、ワードセット生成工程)。ワードセット生成部14は、例えば、時系列毎に記憶された複数の投稿用語として、例えば、特定の期間における複数の投稿情報が含む投稿用語を紐づけて前記ワードセットを生成してもよいし、最新の投稿情報が含む投稿用語と、前記最新の投稿情報以前の投稿情報が含む投稿用語とを紐づけてワードセットを生成してもよい。後者の場合、前記最新の投稿情報以前の投稿情報は、例えば、前記最新の投稿情報から数えて任意の回数前までの投稿情報を使用できる。前記任意の回数は、特に制限されず、例えば、1回前、1~2回前、1~3回前、1~4回前、1~n回前(nは5以上の整数)とできるが、1~4回前であることが好ましい。ワードセット生成部14は、例えば、投稿情報が含む投稿用語が複数ある場合、その全部を紐づけてワードセットを生成してもよいし、その一部を紐づけてワードセットを生成してもよい。
ワードセット生成部14の処理の具体例について、前記表1に示す投稿1~投稿5についての投稿情報と投稿用語とが投稿情報記憶部13に記憶されている場合を例にあげて説明する。ワードセット生成部14は、例えば、最新の前記投稿5に含まれる投稿用語(駅前、新しく、風呂屋、サウナ)と、投稿1~4に含まれる投稿用語(外回り、汗、温泉、ビール、駅前、スーパーA、惣菜、つまみ、ビール、飲んで、パーっと、今日、暑い)とを紐づけ、ユーザのワードセットとして生成する。
つぎに、関連度判定部15により、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定する(S5、関連度判定工程)。前記関連用語記憶部は、ユーザの関連用語が記録された記憶部であり、例えば、本装置10の記憶装置104でもよいし、装置外のデータベース40でもよい。後者の場合、例えば、関連度判定部15は、通信回線網30を介して、装置外のデータベース40に保存されている関連用語を検索し、前記ユーザの関連用語がデータベース40に記憶されているか否かを判定する。データベース40は、例えば、1人のユーザの関連用語が記録されていてもよいし、複数のユーザの関連用語が記録されていてもよいが、後者が好ましい。前記関連用語記憶部は、例えば、ゆるふわDB(データベース)ともいう。
関連度判定部15の処理について、具体的に説明する。関連度判定部15は、前記S4で生成したワードセット「駅前、新しく、風呂屋、サウナ、外回り、汗、温泉、ビール、駅前、スーパーA、惣菜、つまみ、ビール、飲んで、パーっと、今日、暑い」について、前記関連用語記憶部を検索し、これらの用語の組み合わせが関連用語として記憶されているか否かを判定する。前記判定においては、例えば、前記ワードセットが含むすべての用語が記憶されているか否かを判定してもよいし、その一部が記憶されているか否かを判定してもよい。後者の場合、例えば、関連度判定部15は、例えば、前記ワードセットにおいて、最新の投稿情報が含む投稿用語群と、それ以前の投稿情報が含む投稿用語の少なくとも一つが関連用語として記憶されているかを判定できる。具体的には、最新の前記投稿5に含まれる投稿用語(駅前、新しく、風呂屋、サウナ)に対し、投稿1~4に含まれる投稿用語(外回り、汗、温泉、ビール、駅前、スーパーA、惣菜、つまみ、ビール、飲んで、パーっと、今日、暑い)のうち、少なくとも一つが関連用語として記憶されている場合に、関連用語として記憶されていると判定できる。
そして、出力部16は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていない場合(S5、No)、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力し(S6、出力工程)、本装置10による処理を終了する(END)。出力部16は、例えば、通信回線網30を介して、外部データベース40である前記関連用語記憶部に前記関連用語を出力し、前記関連用語記憶部は、出力された前記関連用語を記憶する。なお、出力部16は、例えば、本装置10の記憶装置104に前記関連用語を出力し、記憶装置104が、前記関連用語を記憶してもよい。この場合、例えば、記憶装置104が前記関連用語記憶部として機能する。また、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されている場合(S5、Yes)、本装置10は、処理を終了してもよい(END)。
本実施形態によれば、ユーザが投稿した情報について、時系列に基づいて用語の関連性を記録できる。このため、本発明によれば、例えば、後述する本発明の対話装置において、ユーザに幅広い情報を提供できる。
[実施形態2]
本実施形態は、実施形態1の投稿関連用語生成システム装置100において、投稿関連用語生成装置10が、さらに関連度記録部を含むこと以外は、実施形態1の投稿関連用語生成システム装置100と同様であり、その説明を援用できる。本実施形態の投稿関連用語生成装置は、例えば、関連度記録部を含み、前記関連度記録部は、前記関連度判定部により、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていると判定された場合、前前記関連用語の関連スコアを加点し、前記出力部は、前記関連用語と、前記関連スコアとを紐づけて出力する。このため、本実施形態によれば、例えば、ユーザが投稿した情報について、時系列に基づく用語の関連性をさらに精度よく記録できる。
図5は、本実施形態の投稿関連用語生成装置10A、投稿関連用語生成端末20を含む投稿関連用語生成システム装置100Aの一例の構成を示すブロック図である。図5に示すように、投稿関連用語生成装置10Aは、実施形態1の投稿関連用語生成装置10の構成に加えて、さらに、関連度記録部17を備える。投稿関連用語生成装置10Aのハードウェア構成は、図2の投稿関連用語生成装置10のハードウェア構成において、中央処理装置101が、図1の投稿関連用語生成装置10の構成に代えて、図5の投稿関連用語生成装置10Aの構成を備える以外は同様である。また、投稿関連用語生成端末20のハードウェア構成は、例えば、実施形態1の投稿関連用語生成端末20と同様である。
つぎに、本実施形態の投稿関連用語生成方法の一例を、図6のフローチャートに基づき説明する。本実施形態の投稿関連用語生成方法は、例えば、図5の投稿関連用語生成システム装置100Aを用いて、次のように実施する。なお、本実施形態の投稿関連用語生成方法は、図5の投稿関連用語生成システム装置100Aの使用には限定されない。図6は、投稿関連用語生成システム装置100Aの処理(S1~5、S11、S12、S6)の一例を示すフローチャートである。
まず、実施形態1の投稿関連用語生成システム装置100の処理におけるS1~S4と同様にして、S1~S4を実施する。
つぎに、関連度記録部17は、関連度判定部16により、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていると判定された場合(S5、YES)、前記関連用語の関連スコアを加点する(S11、関連度記録工程)。そして、出力部16は、前記関連用語と、前記関連スコアとを紐づけて出力する(S12、出力工程)。また、例えば、関連度判定部16により、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていると判定された場合(S5、No)、出力部16は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する(S6、出力工程)。
本実施形態の投稿関連用語生成装置100Aによれば、例えば、複数回投稿されたワードセットの関連スコアを加算し、関連用語の関連度を記録することができるため、ユーザが投稿した情報について、時系列に基づく用語の関連性をさらに精度よく記録できる。
[実施形態3]
つぎに、本発明の対話装置について説明する。本発明の対話装置は、例えば、通信部を含み、前記通信部が前記本発明の投稿関連用語生成装置と通信可能であること以外は、公知の対話装置と同様である。本発明の対話装置は、前記通信部が前記本発明の投稿関連用語生成装置と通信可能であることが特徴であり、その他の構成は、何ら制限されない。
本発明の対話装置は、前記本発明の投稿関連用語生成装置と通信可能であるため、時系列に基づき記録された関連用語を参照できる。このため、例えば、前記実施形態1に記載のように、ユーザの投稿の時系列に基づいて、一見脈絡のない「駅前、新しく、風呂屋、サウナ、外回り、汗、温泉、ビール、駅前、スーパーA、惣菜、つまみ、ビール、飲んで、パーっと、今日、暑い」との用語が関連用語であることを参照できる。したがって、本発明の対話装置によれば、例えば、ユーザが、前記対話装置に「今日は暑いね」と投稿した場合に、前記関連用語を参照し、前記ユーザに対し、「外回りですか?お疲れ様です。」、「サウナに行ってさっぱりしたいですね、駅前の温泉にはサウナがありますよ。」、「ビールが飲みたくなりますね、おつまみにはスーパーAのお惣菜がおすすめです。」等の応答を返すことが可能となる。
[実施形態4]
本実施形態のプログラムは、前述の投稿関連用語生成方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、投稿情報取得手順、投稿情報解析手順、投稿情報記憶手順、ワードセット生成手順、関連度判定手順、関連度記録手順、及び出力手順を実行させるためのプログラムである。
前記投稿情報取得手順は、ユーザの投稿情報を取得し、
前記投稿情報解析手順は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
前記投稿情報記憶手順は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
前記ワードセット生成手順は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
前記関連度判定手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語として記憶されているかを判定し、
前記関連度記録手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として記録する。
また、本実施形態のプログラムは、コンピュータを、投稿情報取得手順、投稿情報解析手順、投稿情報記憶手順、ワードセット生成手順、関連度判定手順、関連度記録手順、及び出力手順として機能させるプログラムということもできる。
本実施形態のプログラムは、前記本発明の投稿関連用語生成装置および投稿関連用語生成方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等があげられる。
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
本発明によれば、ユーザが投稿した情報について、時系列に基づいて用語の関連性を記録できる。このため、本発明によれば、ユーザに幅広い情報を提供できる。したがって、本発明は、例えば、ユーザに情報を提供する様々な分野において有用である。
10、10A 投稿関連用語生成装置
11 投稿情報取得部
12 投稿情報解析部
13 投稿情報記憶部
14 ワードセット生成部
15 関連度判定部
16 出力部
17 関連度記録部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 表示装置
107 通信デバイス
100、100A 投稿関連用語生成システム装置
20 投稿関連用語生成端末
21 入力部(入力デバイス)
22 通信部(通信デバイス)
23 表示部(ディスプレイ)
201 中央処理装置
202 メモリ
203 バス
204 記憶装置

Claims (10)

  1. 投稿情報取得部、投稿情報解析部、投稿情報記憶部、ワードセット生成部、関連度判定部、及び出力部を含み、
    前記投稿情報取得部は、ユーザの投稿情報を取得し、
    前記投稿情報解析部は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
    前記投稿情報記憶部は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
    前記ワードセット生成部は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
    前記関連度判定部は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定し、
    前記出力部は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する、ことを特徴とする投稿関連用語生成装置。
  2. 関連度記録部を含み、
    前記関連度記録部は、前記関連度判定部により、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語記憶部に関連用語として記憶されていると判定された場合、前記関連用語の関連スコアを加点し、
    前記出力部は、前記関連用語と、前記関連スコアとを紐づけて出力する、請求項1記載の投稿関連用語生成装置。
  3. 入力部及び通信部を含み、
    前記入力部は、前記投稿情報を入力可能であり、
    前記通信部は、請求項1又は2記載の投稿関連用語生成装置と通信可能であり、前記投稿情報を前記投稿関連用語生成装置に送信可能である、投稿関連用語生成端末。
  4. サーバと、端末とを含み、
    前記サーバと、前記端末とは、互いに通信可能であり、
    前記サーバが、請求項1又は2記載の投稿関連用語生成装置であり、
    前記端末が、請求項3記載の投稿関連用語生成端末である、投稿関連用語生成システム装置。
  5. 通信部を含み、
    前記通信部は、請求項1又は2記載の投稿関連用語生成装置と通信可能である、対話装置。
  6. 投稿情報取得工程、投稿情報解析工程、投稿情報記憶工程、ワードセット生成工程、関連度判定工程、及び出力工程を含み、
    前記投稿情報取得工程は、ユーザの投稿情報を取得し、
    前記投稿情報解析工程は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
    前記投稿情報記憶工程は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
    前記ワードセット生成工程は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
    前記関連度判定工程は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語記憶部に関連用語として記憶されているかを判定し、
    前記出力工程は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する、ことを特徴とする投稿関連用語生成方法。
  7. 関連度記録工程を含み、
    前記関連度記録工程は、前記関連用語に関連スコアを紐づけて記録し、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されている場合、前記関連用語に紐づけられた関連スコアを加点し、
    前記出力工程は、前記関連用語と、前記関連スコアとを紐づけて出力する、請求項6記載の投稿関連用語生成方法。
  8. コンピュータに、投稿情報取得手順、投稿情報解析手順、投稿情報記憶手順、ワードセット生成手順、関連度判定手順、及び出力手順を実行させるためのプログラムであって、
    前記投稿情報取得手順は、ユーザの投稿情報を取得し、
    前記投稿情報解析手順は、前記投稿情報を解析し、前記投稿情報が含む投稿用語を抽出し、
    前記投稿情報記憶手順は、前記投稿情報と、前記投稿情報が含む投稿用語とを、時系列毎に記憶し、
    前記ワードセット生成手順は、時系列毎に記憶された複数の投稿用語を紐づけて、ユーザのワードセットを生成し、
    前記関連度判定手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、関連用語として記憶されているかを判定し、
    前記出力手順は、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されていない場合、前記ワードセットが含む投稿用語の組み合わせを、関連用語として出力する、ことを特徴とするプログラム。
  9. コンピュータに、さらに関連度記録手順を実行させ、
    前記関連度記録手順は、前記関連用語に関連スコアを紐づけて記録し、前記ユーザのワードセットが含む投稿用語の組み合わせが、前記関連用語として記憶されている場合、前記関連用語に紐づけられた関連スコアを加点し、
    前記出力手順は、前記関連用語と、前記関連スコアとを紐づけて出力する、請求項8記載のプログラム。
  10. 請求項8又は9記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。

JP2021109101A 2021-06-30 2021-06-30 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体 Pending JP2023006482A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021109101A JP2023006482A (ja) 2021-06-30 2021-06-30 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021109101A JP2023006482A (ja) 2021-06-30 2021-06-30 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
JP2023006482A true JP2023006482A (ja) 2023-01-18

Family

ID=85108279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021109101A Pending JP2023006482A (ja) 2021-06-30 2021-06-30 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP2023006482A (ja)

Similar Documents

Publication Publication Date Title
US10902076B2 (en) Ranking and recommending hashtags
US20230306052A1 (en) Method and system for entity extraction and disambiguation
WO2019201098A1 (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
AU2018383346A1 (en) Domain-specific natural language understanding of customer intent in self-help
JP6413256B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
US20120179449A1 (en) Automatic story summarization from clustered messages
US11934394B2 (en) Data query method supporting natural language, open platform, and user terminal
US10108698B2 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
US9940355B2 (en) Providing answers to questions having both rankable and probabilistic components
US20220124421A1 (en) Method of generating bullet comment, device, and storage medium
CN114595686B (zh) 知识抽取方法、知识抽取模型的训练方法及装置
JP7280705B2 (ja) 機械学習装置、プログラム及び機械学習方法
GB2528595A (en) Method for user categorization in social media, computer program, and computer
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
US20200004876A1 (en) Systems and methods for contextual ranking of search results
JP2017097488A (ja) 情報処理装置、情報処理方法および情報処理プログラム
US20210224303A1 (en) Searching device and searching program
JP2023006482A (ja) 投稿関連用語生成装置、投稿関連用語生成端末、投稿関連用語生成システム装置、対話装置、投稿関連用語生成方法、プログラム及び記録媒体
KR20100090178A (ko) 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법
JP6687078B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
US20210216886A1 (en) Information providing system and data structure
Zhang et al. NewsQuote: A Dataset Built on Quote Extraction and Attribution for Expert Recommendation in Fact-Checking
JP2022182008A (ja) 情報提案装置、情報提案端末、情報提案システム装置、情報提案方法、プログラム及び記録媒体
JP2019204299A (ja) 検索処理装置およびプログラム
US20240071380A1 (en) Methods and systems for providing insights in real-time during a conversation

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240514