JP2019215660A - 処理プログラム、処理方法および情報処理装置 - Google Patents
処理プログラム、処理方法および情報処理装置 Download PDFInfo
- Publication number
- JP2019215660A JP2019215660A JP2018111863A JP2018111863A JP2019215660A JP 2019215660 A JP2019215660 A JP 2019215660A JP 2018111863 A JP2018111863 A JP 2018111863A JP 2018111863 A JP2018111863 A JP 2018111863A JP 2019215660 A JP2019215660 A JP 2019215660A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- text data
- specified
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、
前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、
生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、
前記符号と、前記情報と、前記文ベクトルデータとを出力する
処理をコンピュータに実行させることを特徴とする処理プログラム。
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、
受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、
生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する、
処理をコンピュータに実行させることを特徴とする処理プログラム。
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、
特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する、
処理をコンピュータに実行させることを特徴とする処理プログラム。
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、
特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する、
処理をコンピュータに実行させることを特徴とする処理プログラム。
テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、
前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、
生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、
前記符号と、前記情報と、前記文ベクトルデータとを出力する
処理を実行することを特徴とする処理方法。
テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、
受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、
生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する、
処理を実行することを特徴とする処理方法。
テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、
特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する、
処理を実行することを特徴とする処理方法。
テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、
特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する、
処理をコンピュータに実行させることを特徴とする処理方法。
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、前記符号と、前記情報と、前記文ベクトルデータとを出力する生成部と
を有することを特徴とする情報処理装置。
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する生成部と
を有することを特徴とする情報処理装置。
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する第1特定部と
を有することを特徴とする情報処理装置。
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する生成部と
を有することを特徴とする情報処理装置。
10b 辞書データ
10c 単語ベクトルテーブル
100,200 情報処理装置
110 通信部
120 入力部
130 表示部
140 記憶部
140a 符号化テキストデータ
140b 転置インデックス
140c 文ベクトルデータ
150 制御部
150a 受付部
150b インデックス・ベクトル生成部
240a 単語HMMデータ
240b センテンスHMMデータ
250a HMM生成部
Claims (15)
- テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、
前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、
生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、
前記符号と、前記情報と、前記文ベクトルデータとを出力する
処理をコンピュータに実行させることを特徴とする処理プログラム。 - 前記情報を生成する処理は、前記テキストデータに含まれる各単語を符号化することで、符号化テキストデータを生成し、前記符号化テキストデータに含まれる単語の符号と、符号の出現位置とを対応付けた転置インデックスを生成することを特徴とする請求項1に記載の処理プログラム。
- 基準を満たす単語の符号と、前記転置インデックスとを基にして、前記符号化テキストデータについて、前記基準を満たす単語の符号の出現位置を特定する処理を更に実行することを特徴とする請求項2に記載の処理プログラム。
- 前記基準を満たす単語の符号と、前記転置インデックスと、前記文ベクトルデータとを基にして、前記基準を満たす単語に関する文ベクトルを特定する処理を更に実行することを特徴とする請求項3に記載の処理プログラム。
- テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、
受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、
生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する、
処理をコンピュータに実行させることを特徴とする処理プログラム。 - テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、
特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する、
処理をコンピュータに実行させることを特徴とする処理プログラム。 - テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、
特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する、
処理をコンピュータに実行させることを特徴とする処理プログラム。 - コンピュータが実行する処理方法であって、
テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、
前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、
生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、
前記符号と、前記情報と、前記文ベクトルデータとを出力する
処理を実行することを特徴とする処理方法。 - コンピュータが実行する処理方法であって、
テキストデータを受け付け、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、
受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、
生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する、
処理を実行することを特徴とする処理方法。 - コンピュータが実行する処理方法であって、
テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、
特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する、
処理を実行することを特徴とする処理方法。 - コンピュータが実行する処理方法であって、
テキストデータを受け付け、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、
受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、
特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する、
処理をコンピュータに実行させることを特徴とする処理方法。 - テキストデータを受け付ける受付部と、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号を生成するとともに、特定した前記単語の前記テキストデータにおける出現位置を該単語に対応付ける情報を生成し、前記テキストデータに含まれる複数のセンテンスの文ベクトルデータを生成し、生成した前記符号と、前記情報と、前記文ベクトルデータとを、受け付けた前記テキストデータに対応付けて記憶し、前記符号と、前記情報と、前記文ベクトルデータとを出力する生成部と
を有することを特徴とする情報処理装置。 - テキストデータを受け付ける受付部と、
受け付けた前記テキストデータに含まれる単語を特定すると、特定した前記単語に応じた符号及び単語ベクトルを生成し、受け付けた前記テキストデータのセンテンスに含まれる単語のうち、基準を満たす単語に応じた単語ベクトルが生成されると、生成した前記単語ベクトルに基づき、前記センテンスに応じた文ベクトルを生成し、生成した前記符号及び文ベクトルを、受け付けた前記テキストデータに対応付けて記憶する生成部と
を有することを特徴とする情報処理装置。 - テキストデータを受け付ける受付部と、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれ単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、受け付けたテキストデータに含まれる単語の前記テキストデータにおける出現位置を該単語に対応付けて記憶する記憶部を参照して、特定した前記単語の前記テキストデータにおける出現位置を特定し、特定した前記出現位置に基づき、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスを特定する第1特定部と
を有することを特徴とする情報処理装置。 - テキストデータを受け付ける受付部と、
辞書データを記憶する記憶部を参照して、前記辞書データに含まれる単語のうち、音素表記又は仮名表記が等しく、かつ、語義が異なる他の単語が存在する単語を特定し、受け付けた前記テキストデータに、特定した前記単語が含まれる場合、前記テキストデータに含まれるセンテンスのうち、特定した前記単語を含むセンテンスに対して特定関係を有する位置に出現するセンテンスを特定し、特定した前記センテンスに基づき、特定した前記センテンスに応じたベクトル情報と、特定した前記単語を含む前記センテンスに対して前記特定関係を有する位置に、該ベクトル情報に応じたセンテンスが出現する頻度情報とを、特定した前記単語に対応付ける情報を生成する生成部と
を有することを特徴とする情報処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018111863A JP7180132B2 (ja) | 2018-06-12 | 2018-06-12 | 処理プログラム、処理方法および情報処理装置 |
US16/432,002 US11797581B2 (en) | 2018-06-12 | 2019-06-05 | Text processing method and text processing apparatus for generating statistical model |
JP2022092800A JP2022121456A (ja) | 2018-06-12 | 2022-06-08 | 処理プログラム、処理方法および情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018111863A JP7180132B2 (ja) | 2018-06-12 | 2018-06-12 | 処理プログラム、処理方法および情報処理装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022092800A Division JP2022121456A (ja) | 2018-06-12 | 2022-06-08 | 処理プログラム、処理方法および情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019215660A true JP2019215660A (ja) | 2019-12-19 |
JP7180132B2 JP7180132B2 (ja) | 2022-11-30 |
Family
ID=68764590
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018111863A Active JP7180132B2 (ja) | 2018-06-12 | 2018-06-12 | 処理プログラム、処理方法および情報処理装置 |
JP2022092800A Pending JP2022121456A (ja) | 2018-06-12 | 2022-06-08 | 処理プログラム、処理方法および情報処理装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022092800A Pending JP2022121456A (ja) | 2018-06-12 | 2022-06-08 | 処理プログラム、処理方法および情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11797581B2 (ja) |
JP (2) | JP7180132B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11620448B2 (en) | 2020-08-31 | 2023-04-04 | Recruit Co., Ltd. | Systems and methods for enhanced review comprehension using domain-specific knowledgebases |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008255A (ja) * | 2011-06-27 | 2013-01-10 | Nec Corp | 文書類似度算出装置 |
JP2014067094A (ja) * | 2012-09-24 | 2014-04-17 | Nippon Telegr & Teleph Corp <Ntt> | 文書評価学習装置、文書評価装置、方法、及びプログラム |
JP2016197396A (ja) * | 2015-04-03 | 2016-11-24 | 株式会社Nttドコモ | 安全テキスト検索 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01185790A (ja) | 1988-01-21 | 1989-07-25 | Fujitsu Ltd | キャッシュレス投票システム |
DE69032712T2 (de) * | 1989-06-14 | 1999-07-01 | Hitachi Ltd | Hierarchischer vorsuch-typ dokument suchverfahren, vorrichtung dazu, sowie eine magnetische plattenanordnung für diese vorrichtung |
US5704060A (en) * | 1995-05-22 | 1997-12-30 | Del Monte; Michael G. | Text storage and retrieval system and method |
US5778361A (en) * | 1995-09-29 | 1998-07-07 | Microsoft Corporation | Method and system for fast indexing and searching of text in compound-word languages |
US9081765B2 (en) * | 2008-08-12 | 2015-07-14 | Abbyy Infopoisk Llc | Displaying examples from texts in dictionaries |
JP5900367B2 (ja) | 2013-01-30 | 2016-04-06 | カシオ計算機株式会社 | 検索装置、検索方法及びプログラム |
JP6167029B2 (ja) | 2013-12-02 | 2017-07-19 | 株式会社Nttドコモ | レコメンド情報生成装置およびレコメンド情報生成方法 |
JP6495124B2 (ja) | 2015-07-09 | 2019-04-03 | 日本電信電話株式会社 | 用語意味コード判定装置、用語意味コード判定モデル学習装置、方法、及びプログラム |
JP6447549B2 (ja) | 2016-03-15 | 2019-01-09 | カシオ計算機株式会社 | テキスト検索装置、テキスト検索方法及びプログラム |
JP6720664B2 (ja) | 2016-04-18 | 2020-07-08 | 富士通株式会社 | インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法 |
EP3616405A4 (en) * | 2017-04-28 | 2021-01-13 | Ascava, Inc. | LOSS-FREE DATA REDUCTION VIA A PRIMARY DATA SIEVE AND PERFORMANCE OF MULTIDIMENSIONAL SEARCH AND ASSOCIATIVE CONTENT RECOVERY ON LOSS-FREE REDUCED DATA USING A PRIMARY DATA SIEVE |
US10824686B2 (en) * | 2018-03-05 | 2020-11-03 | Open Text Sa Ulc | System and method for searching based on text blocks and associated search operators |
CN110147532B (zh) * | 2019-01-24 | 2023-08-25 | 腾讯科技(深圳)有限公司 | 编码方法、装置、设备及存储介质 |
-
2018
- 2018-06-12 JP JP2018111863A patent/JP7180132B2/ja active Active
-
2019
- 2019-06-05 US US16/432,002 patent/US11797581B2/en active Active
-
2022
- 2022-06-08 JP JP2022092800A patent/JP2022121456A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008255A (ja) * | 2011-06-27 | 2013-01-10 | Nec Corp | 文書類似度算出装置 |
JP2014067094A (ja) * | 2012-09-24 | 2014-04-17 | Nippon Telegr & Teleph Corp <Ntt> | 文書評価学習装置、文書評価装置、方法、及びプログラム |
JP2016197396A (ja) * | 2015-04-03 | 2016-11-24 | 株式会社Nttドコモ | 安全テキスト検索 |
Non-Patent Citations (1)
Title |
---|
植松 幸生 他4名: "文単位転置インデックスによる近接検索手法", データベースとWEB情報システムに関するシンポジウム 情報処理学会シンポジウムシリーズ, vol. 2007, no. 3, JPN6022015535, 27 November 2007 (2007-11-27), JP, pages 1 - 7, ISSN: 0004759649 * |
Also Published As
Publication number | Publication date |
---|---|
JP7180132B2 (ja) | 2022-11-30 |
JP2022121456A (ja) | 2022-08-19 |
US11797581B2 (en) | 2023-10-24 |
US20190377746A1 (en) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686361B (zh) | 一种语音合成的方法、装置、计算设备及计算机存储介质 | |
US9824085B2 (en) | Personal language model for input method editor | |
CN102725790B (zh) | 识别词典制作装置及声音识别装置 | |
JP5362095B2 (ja) | インプットメソッドエディタ | |
US6738741B2 (en) | Segmentation technique increasing the active vocabulary of speech recognizers | |
CN113692616B (zh) | 用于在端到端模型中的跨语言语音识别的基于音素的场境化 | |
JP2008216756A (ja) | 語句として新たに認識するべき文字列等を取得する技術 | |
JP2007108749A (ja) | 韻律統計モデル訓練方法及び装置、韻律解析方法及び装置、テキスト音声合成方法及びシステム | |
JP7024364B2 (ja) | 特定プログラム、特定方法および情報処理装置 | |
JP5502814B2 (ja) | アラビア語テキストに発音区別符号を付与するための方法およびシステム | |
JP2010520532A (ja) | 画数の入力 | |
JP5231484B2 (ja) | 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置 | |
JP2007156545A (ja) | 記号列変換方法、単語翻訳方法、その装置およびそのプログラム並びに記録媒体 | |
JP2022121456A (ja) | 処理プログラム、処理方法および情報処理装置 | |
Kominek et al. | Learning pronunciation dictionaries: language complexity and word selection strategies | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
JP7102710B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
US20210142006A1 (en) | Generating method, non-transitory computer readable recording medium, and information processing apparatus | |
JP2007206796A (ja) | 文字処理装置、方法、プログラムおよび記録媒体 | |
JP6972788B2 (ja) | 特定プログラム、特定方法および情報処理装置 | |
JP2000353159A (ja) | 表記・読み対応付け装置、表記・読み対応辞書作成方法、テキスト読み振り装置、テキスト読み振り方法および記録媒体 | |
WO2019003517A1 (ja) | 語義ベクトル生成プログラム、語義ベクトル生成方法および語義ベクトル生成装置 | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
WO2018179729A1 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
US11080488B2 (en) | Information processing apparatus, output control method, and computer-readable recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7180132 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |