JP2022543870A - 情報追跡システムのためのデータエントリ機能 - Google Patents

情報追跡システムのためのデータエントリ機能 Download PDF

Info

Publication number
JP2022543870A
JP2022543870A JP2022507854A JP2022507854A JP2022543870A JP 2022543870 A JP2022543870 A JP 2022543870A JP 2022507854 A JP2022507854 A JP 2022507854A JP 2022507854 A JP2022507854 A JP 2022507854A JP 2022543870 A JP2022543870 A JP 2022543870A
Authority
JP
Japan
Prior art keywords
keywords
keyword
character
processor
tagged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022507854A
Other languages
English (en)
Inventor
エンリケ レイナ ガブリエル
ハーシュフェルド デイビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2022543870A publication Critical patent/JP2022543870A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

【解決手段】テキストデータを処理するための方法は、テキストデータを分析して複数のキーワードを識別することを含む。方法はまた、複数のキーワードの各々が1つ以上のデータベース内に既に存在するかどうかを決定することを含む。方法は、複数のキーワードにおけるあるキーワードが1つ以上のデータベース内において発見されない場合、保存用の複数のキャラクタでそのキーワードをタグ付けすることを含む。複数のキャラクタは、少なくとも、タグ付けの開始を示す第1のキャラクタと、キーワードを保存するための対応するデータベースを示す第2のキャラクタと、タグ付けの終了を示す第3のキャラクタと、を含む。方法はまた、タグ付けされたキーワードを対応するデータベースに保存することを含む。【選択図】図1

Description

関連出願に対する相互参照
本出願は、2019年8月7日に出願された米国仮出願第62/883,917号に対する優先権の利益を主張し、その開示の全体が、参照によりここに明示的に組み込まれる。
本開示は、一般に情報追跡に関し、より具体的には調査情報追跡のためのデータエントリを処理するためのシステム及び方法に関する。
法執行による現在の調査及び報告は、典型的には、従来のワードプロセッシング及び/又は表計算プログラムを用いて手動で処理される。しかし、このようなシステムには、情報を効率的に管理しデータベースに統合する能力が欠けている。例えば、麻薬密売の調査には、データベース内への保存の前に前処理する必要のあるカテゴライズされていない又はタグ付けされていない大量のデータが伴うことがある。従来の方法では、種々のエントリを並べ替えクリーンアップするために膨大な工数が必要であり、これによりエラーが生じやすい場合がある。一部のエラーの性質に起因して、より多くの証拠を収集し、更なる犯罪を防止し、容疑者を逮捕する機会が頓挫する可能性がある。従って、調査の過程で得られたデータをより適切に処理及び管理する必要がある。
一実施形態によれば、本開示は、調査に関連するテキストデータを処理するためのコンピューティングデバイスによる方法を提供する。方法は、テキストデータを分析して複数のキーワードを識別することを含む。方法はまた、複数のキーワードの各々が1つ以上のデータベース内に存在するかどうかを決定することを含む。方法は、複数のキーワードにおけるあるキーワードが1つ以上のデータベース内において発見されない場合、保存用の複数のキャラクタでそのキーワードをタグ付けすることを含む。複数のキャラクタは、少なくとも、タグ付けの開始を示す第1のキャラクタと、キーワードを保存するための対応するデータベースを示す第2のキャラクタと、タグ付けの終了を示す第3のキャラクタと、を含む。
更なる態様では、複数のキャラクタは、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む。第1、第2、及び第3のキャラクタの各々は、2つ以上のキャラクタを有し得る。第2のキャラクタは第1のキャラクタと第3のキャラクタの間にある一方で、キーワードは第2のキャラクタと第3のキャラクタの間にある。
別の態様では、方法は、タグ付けされたキーワードを第1の色で強調して、タグ付けされたキーワードに関する情報を追加するためにユーザ入力が必要であることを示すことを含む。方法は、タグ付けされたキーワードが2つ以上の別個の単語を含む場合、タグ付けされたキーワードを第2の色で強調して、2つ以上の別個の単語を分類するためにユーザ入力が必要であることを示すことを含む。方法は、複数のキーワードにおけるキーワードが1つ以上のデータベース内において発見される場合、キーワードを第3の色で強調して、キーワードが既に存在することを示すことを含む。また、方法は、タグ付けされたキーワードを対応するデータベース内に保存することを含む。タグ付けされたキーワードはまた、複数のデータベース内に保存され得る。
別の実施形態によれば、本開示は、調査に関連するテキストデータを処理するためのシステムを提供する。システムは、プロセッサと、メモリと、1つ以上のデータベースと、を含む。メモリは、プロセッサによって実行されるときに、テキストデータを分析して複数のキーワードを識別することをプロセッサにさせる命令を含む。プロセッサはまた、複数のキーワードの各々が1つ以上のデータベース内に存在するかどうかを決定する。複数のキーワードにおけるあるキーワードが1つ以上のデータベース内において発見されない場合、プロセッサは、保存用の複数のキャラクタでそのキーワードをタグ付けする。複数のキャラクタは、少なくとも、タグ付けの開始を示す第1のキャラクタと、キーワードを保存するための対応するデータベースを示す第2のキャラクタと、タグ付けの終了を示す第3のキャラクタと、を含む。
更なる態様では、複数のキャラクタは、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む。第1、第2、及び第3のキャラクタの各々は、2つ以上のキャラクタを有し得る。第2のキャラクタは第1のキャラクタと第3のキャラクタの間にある一方で、キーワードは第2のキャラクタと第3のキャラクタの間にある。
別の態様では、プロセッサは、タグ付けされたキーワードを第1の色で強調して、タグ付けされたキーワードに関する情報を追加するためにユーザ入力が必要であることを示す。タグ付けされたキーワードが2つ以上の別個の単語を含む場合、プロセッサは、タグ付けされたキーワードを第2の色で強調して、2つ以上の別個の単語を分類するためにユーザ入力が必要であることを示す。複数のキーワードにおけるキーワードが1つ以上のデータベース内において発見される場合、プロセッサは、キーワードを第3の色で強調して、キーワードが既に存在することを示す。また、プロセッサは、タグ付けされたキーワードを対応するデータベース内に保存する。
更に別の実施形態によれば、本開示は、命令を有する非一時的コンピュータ可読媒体を提供する。命令は、プロセッサによって実行されるときに、テキストデータを分析して複数のキーワードを識別することと、複数のキーワードの各々が1つ以上のデータベース内に存在するかどうかを決定することと、をプロセッサにさせる。複数のキーワードにおけるあるキーワードが1つ以上のデータベース内において発見されない場合、命令は、保存用の複数のキャラクタでそのキーワードをタグ付けすることをプロセッサにさせる。複数のキャラクタは、少なくとも、タグ付けの開始を示す第1のキャラクタと、キーワードを保存するための対応するデータベースを示す第2のキャラクタと、タグ付けの終了を示す第3のキャラクタと、を含む。命令はまた、タグ付けされたキーワードを対応するデータベース内に保存することをプロセッサにさせる。複数のキャラクタは、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む。
添付の図面と併せて受け入れられる本発明の実施形態の以下の説明を参照することによって、本開示の上述の及び他の機能(features)並びに利点並びにそれらを達成する方法がより明らかになり、本発明自体もよりよく理解されるはずである。
情報追跡システムを示すブロック図である。
図1の情報追跡システムのためのデータエントリを処理する方法を示すフローチャートである。
種々のサンプルデータベース(example databases)を示す概念図である。
データエントリを処理するための例示的なフォーマットを示す概念図である。
処理されたデータエントリの例を示す概念図である。
処理されたデータエントリのための例示的なユーザインタフェースを示す概念図である。 処理されたデータエントリのための例示的なユーザインタフェースを示す概念図である。 処理されたデータエントリのための例示的なユーザインタフェースを示す概念図である。
処理されたデータエントリの他の例を示す概念図である。 処理されたデータエントリの他の例を示す概念図である。
対応する参照キャラクタは、いくつかの図の全体を通して対応する部分を示す。ここに記載される例示は、本開示の例示的な実施形態を示し、そのような例示は、いかなる方法においても本開示の範囲を限定するものとして解釈されるべきではない。
本開示の原理の理解を促進する目的で、ここでは図面に示されている実施形態を参照し、それらを以下に説明する。ここに開示される例示的な実施形態は、包括的であること、又は本開示を以下の詳細な説明に開示される正確な形式に限定することを意図するものではない。むしろ、これらの例示的な実施形態は、当業者がそれらの教示を利用し得るように選択及び説明されたものである。
「結合する」、「結合された」という用語及びその変形は、2つ以上の構成要素が直接物理的に接触している配置と、2つ以上の構成要素が互いに直接接触していない(例えば、構成要素同士が少なくとも第3の構成要素を介して「結合」されている)にもかかわらずそれらが互いに連携又は相互作用する配置と、を含む。
本開示及び特許請求の範囲の全体を通して、第1及び第2等の数字に関する用語は、種々の構成要素又は機能を参照して使用される。このような使用は、構成要素又は機能の順序を示すことを意図したものではない。むしろ、数字に関する用語は、参照されている構成要素又は機能を読者が識別するのを支援するために使用されるものであり、構成要素又は機能の特定の順序を提供するものとして狭義に解釈されるべきではない。
当業者であれは、提供される実施形態が、ハードウェア、ソフトウェア、ファームウェア、及び/又はそれらの組み合わせにおいて実装され得ることを理解するはずである。実施形態によるプログラミングコードは、C、C++、HTML、XTML、JAVA(登録商標)、若しくは他の実行可能な高水準プログラミング言語又は高水準プログラミング言語と低水準プログラミング言語の組み合わせ等の任意の実行可能なプログラミング言語において実装され得る。
図1は、非一時的コンピュータ可読記憶媒体(例えば、サーバ)上に実装された1つ以上のデータベース106A~106Nとネットワーク104(例えば、ローカルエリアネットワーク、ワイドエリアネットワーク、インターネット等)を介して通信するコンピューティングデバイス102(例えば、デスクトップ、ラップトップ、モバイルデバイス等)を含む情報追跡システム100を示している。データベース106A~106Nは、調査に関連するデータを保存するように構成される。調査は法執行(例えば、薬物譲渡、マネーロンダリング、有線通信不正行為、個人情報の盗難等)に関連していてよいが、他の種類の調査(例えば、雇用問題)又は他の非調査が検討されてもよい。図1は、データベース106A~106Nが別個のユニットであるものとして示しているが、他の実施形態では、データベース106A~106Nは単一のユニットとして実装されてもよい。また、本開示では、データベースは、任意の適切な方法で保存された情報のテーブル、データの保存場所、又は本システム内の保存場所を含んでいてよい。本開示では、任意のタイプのアクセス可能な保存アーキテクチャが検討される。
コンピューティングデバイス102は、プロセッサ108(例えば、マイクロプロセッサ、マイクロコントローラ、論理回路等)、メモリ110、及び通信モジュール112を含む。プロセッサ108は、調査に関連するデータを受信及び処理するように構成される。データを処理することは、データベース106A~106N内での保存のためにデータをカテゴライズ又はタグ付けすることを伴う。一端処理されると、コンピューティングデバイス102は、通信モジュール112を用いてネットワーク104を介してデータをデータベース106A~106Nに送信することができる。プロセッサ108はまた、データを分析し、その分析に基づいて調査報告を生成するように構成される。図示はしないが、コンピューティングデバイス102は、コンピューティングデバイス102を動作させるために用いられる追加的な構成要素(例えば、入力/出力デバイス)を含んでいてよい。
コンピューティングデバイス102を操作しているユーザは、データベース106A~106Nにアクセスして、そこに保存されているデータを読み出し、保存し、及び/又は修正することができる。データは、個人識別情報(例えば、名前)、位置情報(例えば、住所)、車両情報、資産情報、財務情報、及び調査に関連する他の関連情報等の情報を含んでいてよい。一実施形態では、データは、テキストデータ(例えば、電子メール、テキストメッセージ、音声ファイルの文字起こし、手紙等)の形態であってよい。他の実施形態では、データは、ユーザに見える又は見えない場合があるメタデータであってよい。
次に図2を参照すると、調査に関連するテキストデータを処理する方法200が示されている。方法200は、コンピューティングデバイス102によって実行され得る。ブロック202において、コンピューティングデバイス102は、テキストデータを受信及び分析して、複数のキーワードを識別する。キーワードは、保存された用語との比較に基づいて識別され得る。例えば、コンピューティングデバイス102は、テキストデータ内の単語が特定の車両の製造元(make)又はモデルに言及している場合には、車両に関連するキーワードを識別することができる。別の例としては、コンピューティングデバイス102は、テキストデータ内の単語が日付、時刻、曜日等に言及している場合には、イベントに関連するキーワードを識別することができる。更に別の例では、コンピューティングデバイス102は、「@」記号に基づいて電子メールを認識する等、特殊記号に基づいてキーワードを識別することができる。
ブロック204において、コンピューティングデバイス102は、複数のキーワードの各々が1つ以上のデータベース(例えば、データベース106A~106N)内に存在するかどうかを決定する。特に、コンピューティングデバイス102は、データベース106A~106Nの検索を実行して、ある識別されたキーワードがデータベース106A~106Nのいずれかに既に存在するかどうかを決定することができる。
ブロック206において、データベース106A~106Nのいずれにおいてもキーワードが発見されない場合、コンピューティングデバイス102は、特定のデータベースにおける保存のための複数のキャラクタでそのキーワードをタグ付けする。図3は、キーワードが保存され得る種々のサンプルデータベース302をリストにしている。例えば、キーワードが車両に関連している場合、キーワードは、車両データベース(「車両(Vehicles)」)306における保存のためのキャラクタ(「ve」)304でタグ付けされ得る。一実施形態では、データベース302の各々は、図1のデータベース106A~106Nの1つとして実装され得る。
キーワードをタグ付けするために用いられる複数のキャラクタは、少なくとも、タグ付けの開始を示す第1のキャラクタと、キーワードを保存するための対応するデータベースを示す第2のキャラクタと、タグ付けの終了を示す第3のキャラクタと、を含む。第1、第2、及び第3のキャラクタの各々は、2つ以上のキャラクタを含んでいてよい。実例として、図4は、データ402によって表されるキーワードをタグ付けするための例示的なフォーマットを示している。フォワードスラッシュ記号(「/」)の形態の第1のキャラクタ404は、タグ付けの開始を示すために用いられる。2文字(「mw」)の形態の第2のキャラクタ406は、データ402が保存されるべき特定のデータベースを示すために用いられる。この例では、文字「mw」は「送金(Money Wires)」を表し、これは、送金に関連する情報を保存するために用いられるデータベースの名前である。キャレット記号(「^」)の形態の第3のキャラクタ408は、タグ付けの終了を示すために用いられる。データ402の前及び/又は後に1つ以上の空白スペース410が存在していてよい。このように、第2のキャラクタ406は第1のキャラクタ404と第3のキャラクタ408の間にある一方で、データ402(即ちキーワード)は第2のキャラクタ406と第3のキャラクタ408の間にある。尚、タグ付けのフォーマットは、図4に示す実例に限定されず、他の実施形態では他のフォーマットが検討されてよい。例えば、複数のデータベースを示す追加的なキャラクタを含めることにより、あるキーワードは2つ以上のデータベースに保存されてよい。一般に、あるキーワードをタグ付けするために用いられる複数のキャラクタは、標準的なキーボード上で見られる任意の数字並びに文字、数字、句読点、及び特殊記号の組み合わせを含み得る。
コンピューティングデバイス102によりキーワードをタグ付けすることによって、キーワードがデータベース106A~106N内に正確且つ効率的に保存されることが可能になる。これにより、調査の過程で、より簡単な情報の検索、情報の読み出し、情報の関連付け、及び情報の予測が可能になる。一実施形態では、タグ付けはユーザによって実行され得る。
図5は、キーワードを識別及びタグ付けするためにコンピューティングデバイス102によって処理された例示的なテキストデータ500を示している。テキストデータ500は、二者間の電話通話の記述であってよい。あるキーワードがデータベースのいずれにも(例えば、データベース106A~106Nのいずれにも)存在しないことが判明したとコンピューティングデバイス102が決定した場合、そのキーワードは、図4に示すフォーマットに従って複数のキャラクタを用いて保存のためにタグ付けされる。図5では、キーワード502~508が保存のためにタグ付けされている。例えば、キーワード502は俗語であると決定され、そのため、キーワード502は、「vo」と指定された「語彙(Vocabulary)」データベースに保存されるようにタグ付けされる。別の例では、キーワード504は個人の名前であると決定され、そのため、キーワード504は、「nm」と指定された「言及された名前(Names Mentioned)」データベースに保存されるようにタグ付けされる。他の例は、「ad」と指定された「アドレス(Addresses)」データベースに保存されるようにタグ付けされたキーワード506と、「ve」と指定された「車両(Vehicles)」データベースに保存されるようにタグ付けされたキーワード508と、を含む。
いくつかの実施形態では、あるタグ付けされたキーワードは、そのキーワードを説明するために(例えば、ユーザからの)追加情報を必要とすることがある。従って、コンピューティングデバイス102は、タグ付けされたキーワードを第1の色で強調して、タグ付けされたキーワードに関する情報を追加するためにユーザ入力が必要であることを示す。図5では、キーワード502は、追加的なユーザ入力を示すために緑色で強調される。図6を参照し、ユーザがキーワード502を選択する(例えば、ダブルクリックする)と、例示的なユーザインタフェース602が生成される。ユーザインタフェース602は、キーワード502に対してユーザが情報(例えば、定義、メモ等)をエンターすることを可能にするデータエントリウィンドウの形態にある。
いくつかの実施形態では、タグ付けされたキーワードは、2つ以上の別個の単語の組み合わせを備えていてよい。従って、コンピューティングデバイス102は、タグ付けされたキーワードを第2の異なる色で強調して、2つ以上の別個の単語をカテゴライズ又は分類するためにユーザ入力が必要であることを示す。図5では、キーワード508は、追加的なユーザ入力を示すために赤い色で強調される。キーワード508は、車両の色及び製造元をそれぞれ説明する2つの別個の単語704、706を含む。図7を参照し、ユーザがキーワード508を選択する(例えば、ダブルクリックする)と、例示的なユーザインタフェース702が生成される。ユーザインタフェース702は、ユーザが単語704、706をそれらの対応する説明に一致させることを可能にするマッピングウィンドウの形態にある。ユーザインタフェース702はまた、自動投入された(auto-populated)関連情報を示すラベル708を含む。ユーザが単語704、706を成功裏に分類すると、コンピューティングデバイス102は、キーワード508の強調を異なる色(例えば、緑色)に変更してよい。
コンピューティングデバイス102が、あるキーワードがデータベースの1つ(例えば、データベース106A~106Nの1つ)に存在することが判明したと決定した場合、そのキーワードはタグ付けされず、そのキーワードが既に存在することを示すために第3の色で強調される。例えば、図5に戻ると、キーワード510、512は、コンピューティングデバイス102がデータベース内でこれらのキーワードを発見したことを示すために黄色で強調される。
あるキーワードが既に存在する場合、ユーザはそのキーワードに関する情報にもアクセスすることもできる。図8を参照し、既に存在しているキーワード804をユーザが選択する(例えば、ダブルクリックする)と、例示的なユーザインタフェース802が生成される。ユーザインターフェース802は、ユーザがキーワード804に関連する任意の情報を見ること及び/又は修正することを可能にするデータエントリウィンドウの形態にある。
図9~10は、コンピューティングデバイス102によって処理されるテキストデータの他の例を示している。図9では、テキストデータ900は、複数の単語を伴う句の形態にあるタグ付けされたキーワード902を含む。タグ付けされたキーワード902は場所を記述しているが、実際の住所はない。従って、コンピューティングデバイス102は、タグ付けされたキーワード902を、追加的なユーザ入力が必要であること(例えば、異なるソースを通して実際の住所を決定するための追加的なユーザ入力が必要であること)を示す赤で強調している。
いくつかの実施形態では、コンピューティングデバイス102は、あるキーワードを暫定的にタグ付けすることができるが、ユーザがタグ付けを見直すまで又は見直ししない限り、そのキーワードをアクティブ化しない。図10では、テキストデータ1000は、暫定的にタグ付けされたキーワード1002、1004を含む。コンピューティングデバイス102は、それらのキーワードを認識しているが、それらを恒久的にはタグ付けしていない。ユーザは、暫定的にタグ付けされたキーワード1002、1004を見直すことができ、それらを選択する(例えば、ダブルクリックする)と、コンピューティングデバイス102は、キーワード1002、1004を赤で強調することによって、それらのタグ付けをアクティブ化することができる。これはまた、追加的なユーザ入力(例えば、キーワードを説明するための情報)が必要であることを示す。
特定の実施形態では、テキストデータ100を用いてイベントを作成することができる。例えば、上述したデータエントリ処理中にキーワード1004に遭遇すると、これから起きるイベント/カレンダーイベント(upcoming events / calendar event)に対応する「/up tomorrow^」をタイプすることによって、イベントがシステムカレンダーに追加されてよい。
ここに開示されるシステム及び方法は、調査に関連するデータを処理し1つ以上のデータベース内に統合することに関して、改善された効率を可能にする。このような効率により、結果として、調査のための工数の削減及びコスト低減がもたらされ得る。また、そのようなシステム及び方法は、産業界における従来のシステム及び方法に典型的には存在するデータエントリエラーを低減する可能性がある。
ここに開示される実施形態に関連して説明される種々の例示的なモジュール及び論理ブロックは、汎用プロセッサ(例えば、マイクロプロセッサ、マイクロコントローラ、ステートマシン等)、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいはここに説明される機能を実行するように設計されたそれらの任意の組み合わせ等のマシンによって実装又は実行することができる。
ここに開示される実施形態に関連して説明される方法、処理、又はアルゴリズムのステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、又はそれら2つの組み合わせにおいて直接具体化することができる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD-ROM、又は当該技術分野において知られている任意の他の形態のコンピュータ可読記憶媒体内に存在し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるようにプロセッサに結合され得る。代替的には、記憶媒体はプロセッサと一体化され得る。
本発明は例示的な設計を有するものとして説明されてきたが、本発明は、本開示の精神及び範囲内で更に修正することができる。従って、本出願は、本発明の一般原理を用いる本発明の任意の変形、使用、又は適応を網羅することが意図されている。更に、本出願は、本発明が関係する技術分野における既知の又は慣習的な慣行の範囲内にあるような本開示からの逸脱であって、添付の特許請求の範囲の限度内にある逸脱を網羅することが意図されている。
更に、ここに含まれる種々の図に示される接続線は、例示的な機能的関係及び/又は種々の要素間の物理的結合を表すことが意図されている。尚、実用的なシステムにおいては、多くの代替的又は追加的な機能的関係又は物理的接続が存在してよい。但し、利益、利点、問題の解決策、及び任意の利益、利点、又は解決策を生じさせるあるいはそれらがより顕著になる可能性のある任意の要素は、臨界的な、必須の、又は本質的な機能又は要素として解釈されるべきではない。従って、範囲は、添付の特許請求の範囲以外によっては限定されるべきではなく、特許請求の範囲においては、明示的に述べられていない限り、単数形の要素への言及は「唯一の」を意味するのではなく、「1つ以上」を意味することが意図されている。
また、「A、B、又はCの少なくとも1つ」に類似する句が特許請求の範囲で用いられている場合、その句は、ある実施形態においてAのみが存在してよく、ある実施形態においてBのみが存在してよく、ある実施形態においてCのみが存在してよく、あるいは単一の実施形態において要素A、B、又はCの任意の組み合わせが存在してよく、例えば、A及びB、A及びC、B及びC、又はA、B、及びCが存在してよいことを意味するものとして解釈されるべきであることが意図されている。
システム、方法、及び装置がここに提供される。ここでの詳細な説明において、「一実施形態」、「ある実施形態」、「ある例示的な実施形態」等への言及は、説明される実施形態が特定の機能、構造、又は特徴を含んでいてよいが、全ての実施形態が特定の機能、構造、又は特徴を必ずしも含まなくてもよいことを示す。また、そのような句は必ずしも同じ実施形態を参照しているわけではない。更に、特定の機能、構造、又は特徴がある実施形態に関連して説明される場合、そのような機能、構造、又は特徴に影響を与えることは、明示的に記述されているかどうかにかかわらず、他の実施形態に関係する本開示の利益とともに、当業者の知識の範囲内であると考えられる。関連技術の当業者にとっては、明細書を読んだ後に、本開示を代替的な実施形態においてどのように実装するのかは明らかなはずである。
更に、本開示における要素、構成要素、又は方法ステップは、要素、構成要素、又は方法ステップが特許請求の範囲に明示的に記載されているかどうかにかかわらず、公衆に捧げられることを意図していない。ここで用いられる場合、「備える」、「備えている」、又はそれらの任意の他の変形は、非排他的な包含を網羅することを意図しており、例えば、要素のリストを備える処理、方法、物品、又は装置は、それらの要素のみを含むわけではなく、明示的にリストされていない又はそのような処理、方法、物品、又は装置に固有ではない他の要素を含んでいてよい。

Claims (20)

  1. テキストデータを処理するための方法であって、
    コンピューティングデバイスによって前記テキストデータを分析して複数のキーワードを識別することと、
    前記複数のキーワードの各々が1つ以上のデータベース内に存在するかどうかを前記コンピューティングデバイスによって決定することと、
    前記複数のキーワードにおけるキーワードが前記1つ以上のデータベース内において発見されない場合に、前記コンピューティングデバイスによって、保存用の複数のキャラクタで前記キーワードをタグ付けすることと、を備え、
    前記複数のキャラクタが、少なくとも、前記タグ付けの開始を示す第1のキャラクタと、前記キーワードを保存するための対応するデータベースを示す第2のキャラクタと、前記タグ付けの終了を示す第3のキャラクタと、を含む、方法。
  2. 前記複数のキャラクタが、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む、請求項1に記載の方法。
  3. 前記第1、第2、及び第3のキャラクタの各々が2つ以上のキャラクタを備える、請求項1に記載の方法。
  4. 前記第2のキャラクタが前記第1のキャラクタと前記第3のキャラクタの間にあり、前記キーワードが前記第2のキャラクタと前記第3のキャラクタの間にある、請求項1に記載の方法。
  5. 前記タグ付けされたキーワードを第1の色で強調して、前記タグ付けされたキーワードに関する情報を追加するためにユーザ入力が必要であることを示すことを更に備える、請求項1に記載の方法。
  6. 前記タグ付けされたキーワードが2つ以上の別個の単語を含み、前記方法が、前記タグ付けされたキーワードを第2の色で強調して、前記2つ以上の別個の単語を分類するためにユーザ入力が必要であることを示すことを更に備える、請求項5に記載の方法。
  7. 前記複数のキーワードにおける前記キーワードが前記1つ以上のデータベース内において発見される場合に、前記キーワードを第3の色で強調して、前記キーワードが既に存在することを示す、請求項6に記載の方法。
  8. 前記タグ付けされたキーワードを前記対応するデータベース内に保存することを更に備える、請求項1に記載の方法。
  9. 前記タグ付けされたキーワードが複数のデータベース内に保存される、請求項1に記載の方法。
  10. プロセッサと、
    1つ以上のデータベースと、
    前記プロセッサによって実行されるときに、
    テキストデータを分析して複数のキーワードを識別することと、
    前記複数のキーワードの各々が前記1つ以上のデータベース内に存在するかどうかを決定することと、
    前記複数のキーワードにおけるキーワードが前記1つ以上のデータベース内において発見されない場合に、保存用の複数のキャラクタで前記キーワードをタグ付けすることと、を前記プロセッサにさせる命令を含むメモリと、を備え、
    前記複数のキャラクタが、少なくとも、前記タグ付けの開始を示す第1のキャラクタと、前記キーワードを保存するための対応するデータベースを示す第2のキャラクタと、前記タグ付けの終了を示す第3のキャラクタと、を含む、システム。
  11. 前記複数のキャラクタが、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む、請求項10に記載のシステム。
  12. 前記第1、第2、及び第3のキャラクタの各々が2つ以上のキャラクタを備える、請求項10に記載のシステム。
  13. 前記第2のキャラクタが前記第1のキャラクタと前記第3のキャラクタの間にあり、前記キーワードが前記第2のキャラクタと前記第3のキャラクタの間にある、請求項10に記載のシステム。
  14. 前記命令が、前記プロセッサによって実行されるときに、前記タグ付けされたキーワードを第1の色で強調して、前記タグ付けされたキーワードに関する情報を追加するためにユーザ入力が必要であることを示すことを前記プロセッサに更にさせる、請求項10に記載のシステム。
  15. 前記タグ付けされたキーワードが2つ以上の別個の単語を含み、前記命令が、前記プロセッサによって実行されるときに、前記タグ付けされたキーワードを第2の色で強調して、前記2つ以上の別個の単語を分類するためにユーザ入力が必要であることを示すことを前記プロセッサに更にさせる、請求項14に記載のシステム。
  16. 前記複数のキーワードにおける前記キーワードが前記1つ以上のデータベース内において発見される場合に、前記命令が、前記プロセッサによって実行されるときに、前記キーワードを第3の色で強調して、前記キーワードが既に存在することを示すことを前記プロセッサに更にさせる、請求項15に記載のシステム。
  17. 前記命令が、前記プロセッサによって実行されるときに、前記タグ付けされたキーワードを前記対応するデータベース内に保存することを前記プロセッサに更にさせる、請求項10に記載のシステム。
  18. プロセッサによって実行されるときに、
    テキストデータを分析して複数のキーワードを識別することと、
    前記複数のキーワードの各々が前記1つ以上のデータベース内に存在するかどうかを決定することと、
    前記複数のキーワードにおけるキーワードが前記1つ以上のデータベース内において発見されない場合に、保存用の複数のキャラクタで前記キーワードをタグ付けすることと、を前記プロセッサにさせる命令が保存された非一時的コンピュータ可読媒体であって、
    前記複数のキャラクタが、少なくとも、前記タグ付けの開始を示す第1のキャラクタと、前記キーワードを保存するための対応するデータベースを示す第2のキャラクタと、前記タグ付けの終了を示す第3のキャラクタと、を含む、非一時的コンピュータ可読媒体。
  19. 前記命令が、前記プロセッサによって実行されるときに、前記タグ付けされたキーワードを前記対応するデータベース内に保存することを前記プロセッサに更にさせる、請求項18に記載の非一時的コンピュータ可読媒体。
  20. 前記複数のキャラクタが、キーボード上で見られる1つ以上の文字、数字、句読点、及び特殊記号を含む、請求項18に記載の非一時的コンピュータ可読媒体。
JP2022507854A 2019-08-07 2020-08-07 情報追跡システムのためのデータエントリ機能 Pending JP2022543870A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962883917P 2019-08-07 2019-08-07
US62/883,917 2019-08-07
PCT/US2020/045353 WO2021026428A1 (en) 2019-08-07 2020-08-07 Data entry feature for information tracking system

Publications (1)

Publication Number Publication Date
JP2022543870A true JP2022543870A (ja) 2022-10-14

Family

ID=74503740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022507854A Pending JP2022543870A (ja) 2019-08-07 2020-08-07 情報追跡システムのためのデータエントリ機能

Country Status (5)

Country Link
US (2) US11783127B2 (ja)
EP (1) EP4010838A4 (ja)
JP (1) JP2022543870A (ja)
CN (2) CN117112598A (ja)
WO (1) WO2021026428A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11783127B2 (en) * 2019-08-07 2023-10-10 Zinatt Technologies, Inc. Data entry feature for information tracking system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2338807A (en) * 1997-12-29 1999-12-29 Infodream Corp Extraction server for unstructured documents
US20110022941A1 (en) * 2006-04-11 2011-01-27 Brian Osborne Information Extraction Methods and Apparatus Including a Computer-User Interface
US8145654B2 (en) * 2008-06-20 2012-03-27 Lexisnexis Group Systems and methods for document searching
CN102567365B (zh) * 2010-12-26 2016-07-06 上海量明科技发展有限公司 一种针对于关键词进行标注的输入方法及系统
US20130144863A1 (en) 2011-05-25 2013-06-06 Forensic Logic, Inc. System and Method for Gathering, Restructuring, and Searching Text Data from Several Different Data Sources
US9501455B2 (en) * 2011-06-30 2016-11-22 The Boeing Company Systems and methods for processing data
CN105550298B (zh) * 2015-12-11 2019-12-10 北京搜狗科技发展有限公司 一种关键词模糊匹配的方法及装置
US11783127B2 (en) * 2019-08-07 2023-10-10 Zinatt Technologies, Inc. Data entry feature for information tracking system

Also Published As

Publication number Publication date
CN115210708A (zh) 2022-10-18
US20240070391A1 (en) 2024-02-29
EP4010838A4 (en) 2023-08-30
CN115210708B (zh) 2023-09-01
WO2021026428A1 (en) 2021-02-11
US20230141184A1 (en) 2023-05-11
EP4010838A1 (en) 2022-06-15
CN117112598A (zh) 2023-11-24
US11783127B2 (en) 2023-10-10

Similar Documents

Publication Publication Date Title
WO2020232882A1 (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
CN109523153A (zh) 非法集资企业的获取方法、装置、计算机设备和存储介质
US10102256B2 (en) Internet search result intention
US8108413B2 (en) Method and apparatus for automatically discovering features in free form heterogeneous data
US20050177805A1 (en) Methods and apparatuses to generate links from content in an active window
CN109670837A (zh) 债券违约风险的识别方法、装置、计算机设备和存储介质
US10860566B1 (en) Themes surfacing for communication data analysis
US10078689B2 (en) Labeling/naming of themes
US11243971B2 (en) System and method of database creation through form design
US11609959B2 (en) System and methods for generating an enhanced output of relevant content to facilitate content analysis
US20070276883A1 (en) Apparatus, system, and method for pattern-based archiving of business events
WO2021068932A1 (zh) 基于电子书的实体关联信息的展示方法及电子设备
US20240070391A1 (en) Data entry feature for information tracking system
US11757808B2 (en) Data processing for enterprise application chatbot
CN112256863A (zh) 一种确定语料意图的方法、装置及电子设备
CN112330501A (zh) 一种文书处理方法、装置、电子设备及存储介质
Hasanuzzaman et al. Maximum entropy approach for named entity recognition in Bengali and Hindi
CN101894158B (zh) 一种智能检索系统
CN109783612B (zh) 报表数据定位方法及装置、存储介质、终端
CN104240107A (zh) 社群数据筛选系统及其方法
US20210342640A1 (en) Automated machine-learning dataset preparation
US11475529B2 (en) Systems and methods for identifying and linking events in structured proceedings
CN103377199A (zh) 信息处理装置和信息处理方法
CN112015773A (zh) 知识库的检索方法、装置、电子设备以及存储介质
CN111309773A (zh) 一种车辆信息的查询方法、装置、系统及存储介质

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230512

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230728