JP2019204221A - 検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム - Google Patents

検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム Download PDF

Info

Publication number
JP2019204221A
JP2019204221A JP2018098019A JP2018098019A JP2019204221A JP 2019204221 A JP2019204221 A JP 2019204221A JP 2018098019 A JP2018098019 A JP 2018098019A JP 2018098019 A JP2018098019 A JP 2018098019A JP 2019204221 A JP2019204221 A JP 2019204221A
Authority
JP
Japan
Prior art keywords
word
abstract
extracted
specific expression
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018098019A
Other languages
English (en)
Other versions
JP6805206B2 (ja
Inventor
鎮成 齋藤
Shigenari Saito
鎮成 齋藤
山人 原田
Yamato Harada
山人 原田
宮尾 浩
Hiroshi Miyao
浩 宮尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018098019A priority Critical patent/JP6805206B2/ja
Priority to US17/052,338 priority patent/US20210200796A1/en
Priority to PCT/JP2019/019982 priority patent/WO2019225560A1/ja
Publication of JP2019204221A publication Critical patent/JP2019204221A/ja
Application granted granted Critical
Publication of JP6805206B2 publication Critical patent/JP6805206B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】テキスト解析を行うことなく抽象語に対する固有表現を抽出する。【解決手段】検索ワードサジェスト装置は、表データの最左の列を抽出し、その最左の列において最上位に配置される語を抽象語として抽出し、最上位の語の下位に配置される語を、当該抽象語に対する固有表現として抽出する。そして、検索ワードサジェスト装置は、抽出した抽象語および当該抽象語の固有表現を対応付けた抽象語‐固有表現データを作成する。その後、検索ワードサジェスト装置は、検索ワードとして抽象語が入力された場合、この抽象語‐固有表現データを参照して、検索ワードに、固有表現を付与した語を検索ワードの候補としてサジェストする。【選択図】図1

Description

本発明は、検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラムに関する。
ユーザが検索ワードを用いて文書の内容を検索する際に、その内容の具体名を失念し、検索ワードに具体名を投入できないケースがある。例えば、ユーザが、「UPAS所データ」に関する、あるテーブルについて検索したいが、テーブル名を忘れてしまった場合、検索ワードに「所データ」等の抽象的な語を入れるしかない。その結果、ユーザが調べたい内容以外の文書まで表示されてしまい、調べたい内容に行き着くまで時間がかかってしまうことがある。ここで、ユーザが、検索ワードとして抽象的な語(抽象語)を投入した場合に、より具体的な語(固有表現)を提示できれば、ユーザが調べたい内容に行き着くまでの時間を短縮できる。
特許第5506482号公報 特許第5591870号公報
ここで、抽象語に対する固有表現を抽出する方法としては、教師あり学習を用いた自然言語処理を用いる方法が主流である。しかし、この方法では、教師データにない語に関してはテキスト解析の曖昧性により、固有表現を抽出できない場合があるという問題がある。そこで、本発明は、前記した問題を解決し、テキスト解析を行うことなく抽象語に対する固有表現を抽出することを課題とする。
前記した課題を解決するため、本発明は、文書内の表データから、前記表データの最左の列を抽出する列抽出部と、前記抽出した列を構成する語のうち、最上位に配置される語を抽象語として抽出し、前記最上位の語の下位に配置される語を、前記抽出した抽象語に対する固有表現として抽出する固有表現抽出部と、前記抽出した抽象語および前記抽象語の固有表現を対応付けた固有表現情報を作成する情報作成部とを備えることを特徴とする。
本発明によれば、テキスト解析を行うことなく抽象語に対する固有表現を抽出することができる。
図1は、第1の実施形態の検索ワードサジェスト装置の動作例を説明するための図である。 図2は、第1の実施形態の検索ワードサジェスト装置の構成例を示す図である。 図3は、第1の実施形態の検索ワードサジェスト装置が抽象語‐固有表現データを作成する手順の例を示すフローチャートである。 図4は、第1の検索ワードサジェスト装置が検索ワードのサジェストを行う手順の例を示すフローチャートである。 図5は、第2の実施形態の検索ワードサジェスト装置の動作例を説明するための図である。 図6は、第2の実施形態の検索ワードサジェスト装置が抽象語‐固有表現データを作成する手順の例を示すフローチャートである。 図7は、制御プログラムを実行するコンピュータを示す図である。
以下、図面を参照しながら、本発明を実施するための形態(実施形態)を、第1の実施形態および第2の実施形態に分けて説明する。本発明は、各実施形態に限定されない。
[第1の実施形態]
[概要]
第1の実施形態の検索ワードサジェスト装置は、データ検索に用いる検索ワードの候補として、ユーザから入力された検索ワードをより具体的に表現した語(固有表現)を付与した語を、サジェストする。これによりユーザが調べたい内容を具体的に表現した語を思いつくことができなかった場合でも、ユーザが調べたい内容に行き着くまでの時間を短縮できる。
ここで、一般に、文書内の表(表データ)の最左の列は、表内容の主項目を示す列であることが多く、その主項目を示す列には抽象語とその抽象語の固有表現とのペアが現れることが多い。例えば、図1の表「提供ガイダンス一覧」における最左の列(列101)は、この表の主項目を示す列であり、上から順に、ガイダンス種類、未使用番号、空番、裏番号ダイヤル等の語が格納されている。これらの語のうち、最上位に配置されるガイダンス種類という語と、その下に配置される、未使用番号、空番、裏番号ダイヤル等の語とは、抽象語と、当該抽象語の固有表現という関係になっている。
このような性質に着目し、検索ワードサジェスト装置は、表の最左の列の語のうち、最上位に配置される語を抽象語として抽出し、最上位の語の下に配置される語を当該抽象語の固有表現として抽出する。そして、検索ワードサジェスト装置は、抽出した固有表現と固有表現とを対応付けた抽象語‐固有表現データ(固有表現情報)を作成する。その後、検索ワードサジェスト装置は、この抽象語‐固有表現データに登録されている抽象語が検索ワードとして入力されると、この抽象語に、この抽象語の固有表現を付与した語を検索ワードの候補としてサジェストする。
例えば、検索ワードサジェスト装置は、「ガイダンス種類」という語が検索ワードとして入力された場合、図1に示すように、「ガイダンス種類」に、抽象語‐固有表現データにおいて「ガイダンス種類」の固有表現となる語(未使用番号、空番、裏番号直接等)を付与した語を検索ワードの候補(候補1〜3)としてサジェストする。
このようにすることで、ユーザが調べたい内容(例えば、「ガイダンス種類」)についてその内容を具体的に表現した語(例えば、「未使用番号」、「空番」、「裏番号直接」等)を思いつくことができなかった場合でも、サジェストされた検索ワードの候補の中から、ユーザが調べたい内容を具体的に表現した語を発見することができる。そして、情報検索装置が、ユーザにより選択された検索ワードを用いて情報検索を行うことで、ユーザが調べたい内容に近い内容を検索結果として出力することができる。その結果、ユーザが調べたい内容に行き着くまでの時間を短縮できる。
また、検索ワードサジェスト装置10は、抽象語‐固有表現データの作成にあたり、抽象語とその抽象語の固有表現のペアが現れやすい、表の最左の列の語を用いるので、テキスト解析等を行う場合よりも、抽象語に対する固有表現を抽出しやすくなる。
[構成]
次に、図2を用いて検索ワードサジェスト装置10の構成を説明する。検索ワードサジェスト装置10は、入出力部(入力部および出力部)11と、記憶部12と、制御部13とを備える。入出力部11は、検索ワードサジェスト装置10の入出力インタフェースを司る。この入出力部11は、例えば、ユーザから検索ワードの入力を受け付けたり、検索ワードのサジェスト結果(検索ワードの候補)を出力したりする。
記憶部12は、制御部13が検索ワードのサジェストを行うための種々の情報を記憶する。例えば、記憶部12は、1以上の表データを記憶する。また、記憶部12は、制御部13から出力される抽象語‐固有表現データを記憶する領域を備える。
制御部13は、列抽出部131と、固有表現抽出部132と、データ作成部133と、サジェスト部134とを備える。
列抽出部131は、表データから、当該表データの内容の主項目を示す列を抽出する。例えば、列抽出部131は、記憶部12の表データから、当該表データ(表)の最左の列を抽出する。また、列抽出部131は、表データの最左の列が項番を示す列である可能性がある場合、あるいは、表データの最左の列に「○」、「‐」、「同上」等の意味をなさない文字列が格納されている場合、当該表データにおける最左の列の右側に隣接する列を抽出してもよい。このようにすることで、列抽出部131は、当該表データの内容の主項目を示す列を確実に抽出しやすくなる。
固有表現抽出部132は、列抽出部131により抽出された列(例えば、表の最左の列)を構成する語のうち、当該列において最上位に配置される語を抽象語として抽出し、当該列において最上位の語の下位に配置される語を、当該抽象語に対する固有表現として抽出する。例えば、固有表現抽出部132は、図1に示す表の最左の列において、最上位に配置される「ガイダンス種類」を抽象語として抽出し、その列において「ガイダンス種類」の下位に配置される「未使用番号」、「空番」、「裏番号直接」を、「ガイダンス種類」に対する固有表現として抽出する。
データ作成部133は、固有表現抽出部132により抽出された抽象語および当該抽象語の固有表現を対応付けた抽象語‐固有表現データ(固有表現情報)を作成する。例えば、データ作成部133は、図1に示すように、抽象語「ガイダンス種類」に対し、「未使用番号」、「空番」、「裏番号直接」を固有表現として対応付けた抽象語‐固有表現データを作成し、記憶部12に格納する。
サジェスト部134は、ユーザへの検索ワードのサジェストを行う。具体的には、サジェスト部134は、データ作成部133による抽象語‐固有表現データの作成後、入出力部11経由でユーザから、抽象語‐固有表現データに含まれる抽象語が検索ワードとして入力された場合、検索に用いる検索ワードの候補として、抽象語‐固有表現データから当該検索ワードに対する固有表現を付与した語をサジェストする。
例えば、サジェスト部134は、検索ワードとして上記の「ガイダンス種類」という語が入力された場合、抽象語‐固有表現データにおいて「ガイダンス種類」の固有表現となる語(未使用番号、空番、裏番号直接等)を付与した語を検索ワードの候補(候補1〜3)としてサジェストする(図1参照)。なお、サジェストされた検索ワードの候補は、例えば、ユーザが検索ワードを入力した画面領域の下等に表示される。その後、ユーザは、画面上に表示された検索ワードおよびサジェストされた検索ワードの中から、検索に用いる検索ワードの選択入力を行う。そして、検索ワードサジェスト装置10または情報検索装置(図示省略)は、ユーザから選択された検索ワードを用いて、情報検索を行う。
[処理手順]
次に、検索ワードサジェスト装置10の処理手順を説明する。まず、図3を用いて、検索ワードサジェスト装置10が抽象語‐固有表現データを作成する手順の例を説明し、次に、図4を用いて、検索ワードサジェスト装置10が、抽象語‐固有表現データを用いて検索ワードのサジェストを行う手順の例を説明する。なお、検索ワードサジェスト装置10は、表データ(表)の内容の主項目を示す列として、表の最左の列を抽出する場合を例に説明する。
例えば、検索ワードサジェスト装置10の列抽出部131は、記憶部12の表データから、当該表データ(表)の最左の列を抽出する(S1)。次に、固有表現抽出部132は、当該列において最上位に配置される語を抽象語として抽出する(S2)。また、固有表現抽出部132は、当該列において最上位の語の下位に配置される語を最上位の語に対する固有表現として抽出する(S3)。そして、データ作成部133は、抽出された抽象語と当該抽象語の固有表現とを対応付けたデータ(抽象語‐固有表現データ)を作成する(S4)。その後、データ作成部133は、作成した抽象語‐固有表現データを記憶部12に格納する。このようにすることで、検索ワードサジェスト装置10は、抽象語‐固有表現データを作成することができる。
図4の説明に移る。検索ワードサジェスト装置10の入出力部11が検索ワードの入力を受け付け(S11)、入力された検索ワードが、抽象語‐固有表現データにおいて抽象語として登録されていれば(S12でYes)、サジェスト部134は、抽象語‐固有表現データにおける当該検索ワードに対する固有表現を読み出す。そして、サジェスト部134は、当該検索ワードに、当該検索ワードの固有表現を付与した語を検索ワードの候補としてサジェストする(S13)。一方、入力された検索ワードが抽象語‐固有表現データにおいて抽象語として登録されていなければ(S12でNo)、サジェスト部134は、S13の処理を実行しない。
このようにすることで、ユーザが調べたい内容(例えば、「ガイダンス種類」)についてその内容を具体的に表現した語(例えば、「未使用番号」、「空番」、「裏番号直接」等)を思いつくことができなかった場合でも、検索ワードサジェスト装置10は、ユーザに、その内容を具体的に表現した語(例えば、「未使用番号」、「空番」、「裏番号直接」等)を付与した語を検索ワードの候補としてサジェストすることができる。
[第2の実施形態]
次に、本発明の第2の実施形態を説明する。第1の実施形態と同じ構成については同じ符号を用いて説明を省略する。第2の実施形態の検索ワードサジェスト装置10の列抽出部131は、表データ(表)の内容の主項目を示す列として、当該表から、当該表のタイトルの文字列を含む語が最上位に配置される列を抽出する。
例えば、列抽出部131は、図5に示すように、表データのうち、タイトル「**一覧」(例えば、「UPAS所データ一覧」)が付されている表データ(表)を取得する。そして、列抽出部131は、取得した表から、当該タイトルに含まれる文字列(例えば、「所データ」)を含む語(例えば、「所データ名」)が最上位に配置される列(列501)を抽出する。
そして、固有表現抽出部132は、第1の実施形態と同様に、列抽出部131により抽出された列について、当該列を構成する語のうち、最上位に配置される語を抽象語として抽出し、最上位の語の下位に配置される語を、当該抽象語に対する固有表現として抽出する。
例えば、固有表現抽出部132は、図5の列501を構成する語のうち、最上位に配置される「所データ」を抽象語として抽出し、「所データ(所データ名)」の下位に配置される「自UPASクラスタ情報」、「対向CA情報」、「対向MS・CSS情報」を、抽象語「所データ(所データ名)」に対する固有表現として抽出する。そして、データ作成部133は、抽象語「所データ(所データ名)」に対し、「自UPASクラスタ情報」、「対向CA情報」、「対向MS・CSS情報」を固有表現として対応付けた抽象語‐固有表現データを作成し、記憶部12に格納する。そして、サジェスト部134は、作成した抽象語‐固有表現データを用いて、ユーザへの検索ワードの候補のサジェストを行う。
[処理手順]
次に、図6を用いて、第2の検索ワードサジェスト装置10が抽象語‐固有表現データを作成する手順の例を説明する。まず、検索ワードサジェスト装置10の列抽出部131は、記憶部12からタイトルが付されている表データを取得する(S21)。その後、列抽出部131は、当該表データのタイトルに含まれる文字列を含む語が最上位に配置される列を抽出する(S22)。その後の、S23〜S25の処理は、図4のS2〜S4の処理と同様なので説明を省略する。
このような検索ワードサジェスト装置10によれば、抽象語‐固有表現データの作成にあたり、表を構成する列のうち、当該表のタイトルの文字列を含む語が最上位に配置される列の語を用いるので、テキスト解析等を行う場合よりも、抽象語に対する固有表現を抽出しやすくなる。
[プログラム]
また、上記の実施形態で述べた検索ワードサジェスト装置10の機能を実現するプログラムを所望の情報処理装置(コンピュータ)にインストールすることによって実装できる。例えば、パッケージソフトウェアやオンラインソフトウェアとして提供される上記のプログラムを情報処理装置に実行させることにより、情報処理装置を検索ワードサジェスト装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等がその範疇に含まれる。また、検索ワードサジェスト装置10を、クラウドサーバに実装してもよい。
図7を用いて、上記のプログラム(制御プログラム)を実行するコンピュータの一例を説明する。図7に示すように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011およびRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。ディスクドライブ1100には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1110およびキーボード1120が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1130が接続される。
ここで、図7に示すように、ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。前記した実施形態で説明した各種データや情報は、例えばハードディスクドライブ1090やメモリ1010に記憶される。
そして、CPU1020が、ハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
なお、上記の制御プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、上記のプログラムに係るプログラムモジュール1093やプログラムデータ1094は、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
10 検索ワードサジェスト装置
11 入出力部
12 記憶部
13 制御部
131 列抽出部
132 固有表現抽出部
133 データ作成部
134 サジェスト部

Claims (6)

  1. 文書内の表データから、前記表データの最左の列を抽出する列抽出部と、
    前記抽出した列を構成する語のうち、最上位に配置される語を抽象語として抽出し、前記最上位の語の下位に配置される語を、前記抽出した抽象語に対する固有表現として抽出する固有表現抽出部と、
    前記抽出した抽象語および前記抽象語の固有表現を対応付けた固有表現情報を作成する情報作成部と
    を備えることを特徴とする検索ワードサジェスト装置。
  2. 前記列抽出部は、
    前記表データの最左の列が項番を示す列である場合、前記項番を示す列の右側に隣接する列を抽出することを特徴とする請求項1に記載の検索ワードサジェスト装置。
  3. 文書内の表データのうち、タイトルが付されている表データから、前記表データのタイトルの文字列を含む語が最上位に配置される列を抽出する列抽出部と、
    前記抽出した列を構成する語のうち、最上位に配置される語を抽象語として抽出し、前記最上位の語の下位に配置される語を、前記抽出した抽象語に対する固有表現として抽出する固有表現抽出部と、
    前記抽出した抽象語および前記抽象語の固有表現を対応付けた固有表現情報を作成する情報作成部と
    を備えることを特徴とする検索ワードサジェスト装置。
  4. 前記固有表現情報に含まれる抽象語が検索ワードとして入力された場合、前記検索ワードの候補として、前記固有表現情報を参照して、前記入力された検索ワードに対する固有表現を読み出し、前記読み出した固有表現を前記検索ワードに付与してサジェストするサジェスト部
    をさらに備えることを特徴とする請求項1〜3のいずれか1項に記載の検索ワードサジェスト装置。
  5. 検索ワードサジェスト装置により実行される固有表現情報の作成方法であって、
    文書内の表データから、前記表データの最左の列を抽出するステップと、
    前記抽出した列を構成する語のうち、最上位に配置される語を抽象語として抽出し、前記最上位の語の下位に配置される語を、前記抽出した抽象語に対する固有表現として抽出するステップと、
    前記抽出した抽象語および前記抽象語の固有表現を対応付けた固有表現情報を作成するステップと
    を含んだことを特徴とする固有表現情報の作成方法。
  6. 文書内の表データから、前記表データの最左の列を抽出するステップと、
    前記抽出した列を構成する語のうち、最上位に配置される語を抽象語として抽出し、前記最上位の語の下位に配置される語を、前記抽出した抽象語に対する固有表現として抽出するステップと、
    前記抽出した抽象語および前記抽象語の固有表現を対応付けた固有表現情報を作成するステップと
    をコンピュータに実行させることを特徴とする固有表現情報の作成プログラム。
JP2018098019A 2018-05-22 2018-05-22 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム Active JP6805206B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018098019A JP6805206B2 (ja) 2018-05-22 2018-05-22 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム
US17/052,338 US20210200796A1 (en) 2018-05-22 2019-05-20 Search word suggestion device, method for generating unique expression informaton, and program for generating unique expression information
PCT/JP2019/019982 WO2019225560A1 (ja) 2018-05-22 2019-05-20 検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018098019A JP6805206B2 (ja) 2018-05-22 2018-05-22 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム

Publications (2)

Publication Number Publication Date
JP2019204221A true JP2019204221A (ja) 2019-11-28
JP6805206B2 JP6805206B2 (ja) 2020-12-23

Family

ID=68616728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018098019A Active JP6805206B2 (ja) 2018-05-22 2018-05-22 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム

Country Status (3)

Country Link
US (1) US20210200796A1 (ja)
JP (1) JP6805206B2 (ja)
WO (1) WO2019225560A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307198A (zh) * 2020-11-24 2021-02-02 腾讯科技(深圳)有限公司 一种单文本的摘要确定方法和相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309666A (ja) * 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
JP2010272006A (ja) * 2009-05-22 2010-12-02 Nec Corp 関係抽出装置、関係抽出方法、及びプログラム
JP2012083935A (ja) * 2010-10-12 2012-04-26 Ird:Kk 特許検索装置、特許検索方法、およびプログラム
WO2014188555A1 (ja) * 2013-05-23 2014-11-27 株式会社日立製作所 テキスト処理装置、及び、テキスト処理方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424980B1 (en) * 1998-06-10 2002-07-23 Nippon Telegraph And Telephone Corporation Integrated retrieval scheme for retrieving semi-structured documents
US6339795B1 (en) * 1998-09-24 2002-01-15 Egrabber, Inc. Automatic transfer of address/schedule/program data between disparate data hosts
US6721727B2 (en) * 1999-12-02 2004-04-13 International Business Machines Corporation XML documents stored as column data
US7017162B2 (en) * 2001-07-10 2006-03-21 Microsoft Corporation Application program interface for network software platform
US7640496B1 (en) * 2003-10-31 2009-12-29 Emc Corporation Method and apparatus for generating report views
US20080232219A1 (en) * 2007-03-16 2008-09-25 Sharma Yugal K High throughput system for legacy media conversion
US8285748B2 (en) * 2008-05-28 2012-10-09 Oracle International Corporation Proactive information security management
US8935266B2 (en) * 2009-04-08 2015-01-13 Jianqing Wu Investigative identity data search algorithm
US8548997B1 (en) * 2009-04-08 2013-10-01 Jianqing Wu Discovery information management system
US8073718B2 (en) * 2009-05-29 2011-12-06 Hyperquest, Inc. Automation of auditing claims
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
US8898798B2 (en) * 2010-09-01 2014-11-25 Apixio, Inc. Systems and methods for medical information analysis with deidentification and reidentification
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
JP5833998B2 (ja) * 2012-11-21 2015-12-16 株式会社日立製作所 組立作業性評価計算装置、および組立作業性評価方法
JP6020161B2 (ja) * 2012-12-28 2016-11-02 富士通株式会社 グラフ作成プログラム、情報処理装置、およびグラフ作成方法
US10860557B2 (en) * 2013-03-13 2020-12-08 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing change value indication and historical value comparison
US11775136B2 (en) * 2016-04-27 2023-10-03 Coda Project, Inc. Conditional formatting
US10108600B2 (en) * 2016-09-16 2018-10-23 Entigenlogic Llc System and method of attribute, entity, and action organization of a data corpora
US11176463B2 (en) * 2016-12-05 2021-11-16 International Business Machines Corporation Automating table-based groundtruth generation
US11755997B2 (en) * 2017-02-22 2023-09-12 Anduin Transactions, Inc. Compact presentation of automatically summarized information according to rule-based graphically represented information
US10534825B2 (en) * 2017-05-22 2020-01-14 Microsoft Technology Licensing, Llc Named entity-based document recommendations
EP3462331B1 (en) * 2017-09-29 2021-08-04 Tata Consultancy Services Limited Automated cognitive processing of source agnostic data
US20190102620A1 (en) * 2017-09-29 2019-04-04 Rovi Guides, Inc. Systems and methods for detecting semantics of columns from tabular data
US20190213407A1 (en) * 2018-01-11 2019-07-11 Teqmine Analytics Oy Automated Analysis System and Method for Analyzing at Least One of Scientific, Technological and Business Information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309666A (ja) * 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
JP2010272006A (ja) * 2009-05-22 2010-12-02 Nec Corp 関係抽出装置、関係抽出方法、及びプログラム
JP2012083935A (ja) * 2010-10-12 2012-04-26 Ird:Kk 特許検索装置、特許検索方法、およびプログラム
WO2014188555A1 (ja) * 2013-05-23 2014-11-27 株式会社日立製作所 テキスト処理装置、及び、テキスト処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307198A (zh) * 2020-11-24 2021-02-02 腾讯科技(深圳)有限公司 一种单文本的摘要确定方法和相关装置
CN112307198B (zh) * 2020-11-24 2024-03-12 腾讯科技(深圳)有限公司 一种单文本的摘要确定方法和相关装置

Also Published As

Publication number Publication date
JP6805206B2 (ja) 2020-12-23
WO2019225560A1 (ja) 2019-11-28
US20210200796A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
US8935148B2 (en) Computer-assisted natural language translation
US9262403B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
US9824085B2 (en) Personal language model for input method editor
US9965569B2 (en) Truncated autosuggest on a touchscreen computing device
US9977766B2 (en) Keyboard input corresponding to multiple languages
US10366142B2 (en) Identifier based glyph search
van Esch et al. Writing across the world's languages: Deep internationalization for Gboard, the Google keyboard
JP6705352B2 (ja) 言語処理装置、言語処理方法、及び言語処理プログラム
WO2019225560A1 (ja) 検索ワードサジェスト装置、固有表現情報の作成方法、および、固有表現情報の作成プログラム
US20180011925A1 (en) Displaying conversion candidates associated with input character string
WO2012015021A1 (en) Stroke and structure input method and system
US20150186363A1 (en) Search-Powered Language Usage Checks
JP5931015B2 (ja) 情報処理装置、システム、サーバ装置、端末及び情報処理方法
JP6897168B2 (ja) 情報処理装置及び情報処理プログラム
US10546061B2 (en) Predicting terms by using model chunks
JP6076285B2 (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP7295463B2 (ja) 業務フロー作成支援装置、業務フロー作成支援方法、および、業務フロー作成支援プログラム
US20140365405A1 (en) Context Aware Information Prediction
JP2017097451A (ja) 情報処理方法、情報処理プログラムおよび情報処理装置
JP6447068B2 (ja) 情報処理装置、情報表示方法及びプログラム
JP2023039822A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022177381A (ja) 文書処理プログラム
KR20240053713A (ko) 다수 개의 언어를 신속하게 번역하는 방법, 장치 및 시스템
KR20240053711A (ko) 다국어 번역 방법, 장치 및 시스템
KR20240053714A (ko) 스마트 번역 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201203

R150 Certificate of patent or registration of utility model

Ref document number: 6805206

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150