JP7298192B2 - 生成装置、生成方法及びプログラム - Google Patents
生成装置、生成方法及びプログラム Download PDFInfo
- Publication number
- JP7298192B2 JP7298192B2 JP2019037605A JP2019037605A JP7298192B2 JP 7298192 B2 JP7298192 B2 JP 7298192B2 JP 2019037605 A JP2019037605 A JP 2019037605A JP 2019037605 A JP2019037605 A JP 2019037605A JP 7298192 B2 JP7298192 B2 JP 7298192B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- character
- word
- characters
- appearances
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
まず、本発明の実施の形態における生成装置10の機能構成について、図1を参照しながら説明する。図1は、本発明の実施の形態における生成装置10の機能構成の一例を示す図である。
次に、本発明の実施の形態における生成装置10のハードウェア構成について、図2を参照しながら説明する。図2は、本発明の実施の形態における生成装置10のハードウェア構成の一例を示す図である。
次に、本発明の実施の形態における生成装置10がアナグラムを生成及び出力する処理について、図3を参照しながら説明する。図3は、本発明の実施の形態におけるアナグラム生成及び出力処理の一例を示すフローチャートである。
次に、上記のステップS102における出現回数ベクトルF及び行列Xを作成する処理について、図4を参照しながら説明する。図4は、本発明の実施の形態における出現回数ベクトル及び行列の作成処理の一例を示すフローチャートである。
次に、上記のステップS104及びステップS107における探索処理について、図6を参照しながら説明する。図6は、本発明の実施の形態における探索処理の一例を示すフローチャートである。なお、探索処理は、出現回数ベクトルFと行列Xと文Sとを引数とする関数SEARCH(F, X, S)が呼び出されることで実行される。
条件付き確率p(wr|S)が所定の閾値以上である場合は制約条件1を満たし、そうでない場合は制約条件1を満たさない。
選択単語wrに含まれる全ての文字の出現回数が、出現頻度ベクトルFでこれら全ての文字にそれぞれ対応する要素の値以下である場合は制約条件2を満たし、そうでない場合は制約条件2を満たさない。
選択単語wrが集合Mに含まれていない場合は制約条件3を満たし、そうでない場合は制約条件3を満たさない。
以上により、本発明の実施の形態における生成装置10では、与えられた文字列を用いて、深さ優先探索アルゴリズムにより、制約条件を満たす他の文字列(例えば、文として自然なアナグラム等)を生成することが可能となる。また、このとき、本発明の実施の形態における生成装置10では、他の文字列を構成する単語が制約条件を満たさない場合には、深さ優先探索アルゴリズムの枝刈りを行うことで、効率的に制約条件を満たす他の文字列を生成することが可能となる。
101 入力部
102 行列作成部
103 探索処理部
104 出力部
105 終了条件判定部
106 語彙記憶部
107 言語モデル記憶部
Claims (6)
- 生成対象の文字列に含まれる複数の文字に関するデータである第1のデータを入力する入力手段と、
前記第1のデータが表す複数の文字に含まれる各文字の出現回数に基づいて、前記第1のデータが表す複数の文字に含まれる各文字の出現回数に関するデータを第1の出現回数データとして作成する第1の出現回数データ作成手段と、
複数の単語データが記憶されている語彙記憶部を参照して、単語に含まれる各文字それぞれの出現回数が、前記第1の出現回数データが表す各文字それぞれの出現回数以下である単語の単語データを前記語彙記憶部から取得し、取得した各単語データそれぞれが表す単語に含まれる各文字の出現回数に関するデータを第2の出現回数データとして作成する第2の出現回数データ作成手段と、
前記第1のデータと、前記第1の出現回数データと、前記第2の出現回数データと、前記第1のデータが表す複数の文字から前記文字列を生成するための深さ優先探索アルゴリズムの制約条件とに基づいて、前記深さ優先探索アルゴリズムにより前記制約条件を満たす前記文字列に関するデータである第2のデータを生成する生成手段と、
を有し、
前記生成手段は、
前記語彙記憶部から取得された単語データが表す単語を選択単語として選択し、これまでに選択した選択単語の列で構成される文字列が前記制約条件を満たすか否かを判定し、前記制約条件を満たさない場合は最後に選択された選択単語を前記列から削除する、ことを、前記第1のデータが表す複数の文字に含まれる各文字の各々の文字に関して、これまでに選択した選択単語の列で構成される文字列に含まれる当該文字の出現回数と、前記第1のデータが表す複数の文字に含まれる当該文字の出現回数とが一致するまで、繰り返し、
前記繰り返しの終了後、これまでに選択した選択単語の列で構成される文字列に関するデータを前記第2のデータとして生成し、
前記制約条件には、
これまでに選択した選択単語の列で構成される文字列を構成する文字の並びの尤もらしさに関する第1の条件と、
前記第1のデータが表す複数の文字に含まれる各文字の各々の文字に関して、これまでに選択した選択単語の列で構成される文字列に含まれる当該文字の出現回数が、前記第1のデータが表す複数の文字に含まれる当該文字の出現回数以下であることを表す第2の条件、が含まれる、ことを特徴とする生成装置。 - 前記深さ優先アルゴリズムでは、
これまでに選択した選択単語の列で構成される文字列が前記制約条件を満たさない場合、最後に選択された選択単語以降の単語の探索は行わない、ことを特徴とする請求項1に記載の生成装置。 - 前記尤もらしさに関する条件は、
所定の言語モデル又はルールベース手法によって算出される、これまでに選択した選択単語の列で構成される文字列を構成する文字の並びの尤もらしさを表す値に関する条件である、ことを特徴とする請求項1又は2に記載の生成装置。 - 前記第1のデータが表す複数の文字は、文、単語、句、節、単語の集合、文字と該文字の個数との組、のうちの少なくとも1つである、ことを特徴とする請求項1乃至3の何れか一項に記載の生成装置。
- 生成対象の文字列に含まれる複数の文字に関するデータである第1のデータを入力する入力手順と、
前記第1のデータが表す複数の文字に含まれる各文字の出現回数に基づいて、前記第1のデータが表す複数の文字に含まれる各文字の出現回数に関するデータを第1の出現回数データとして作成する第1の出現回数データ作成手順と、
複数の単語データが記憶されている語彙記憶部を参照して、単語に含まれる各文字それぞれの出現回数が、前記第1の出現回数データが表す各文字それぞれの出現回数以下である単語の単語データを前記語彙記憶部から取得し、取得した各単語データそれぞれが表す単語に含まれる各文字の出現回数に関するデータを第2の出現回数データとして作成する第2の出現回数データ作成手順と、
前記第1のデータと、前記第1の出現回数データと、前記第2の出現回数データと、文字の並びの尤もらしさに関する条件が少なくとも含まれる制約条件であって、前記第1のデータが表す複数の文字から前記文字列を生成するための深さ優先探索アルゴリズムの制約条件とに基づいて、前記深さ優先探索アルゴリズムにより前記制約条件を満たす前記文字列に関するデータである第2のデータを生成する生成手順と、
をコンピュータが実行し、
前記生成手順は、
前記語彙記憶部から取得された単語データが表す単語を選択単語として選択し、これまでに選択した選択単語の列で構成される文字列が前記制約条件を満たすか否かを判定し、前記制約条件を満たさない場合は最後に選択された選択単語を前記列から削除する、ことを、前記第1のデータが表す複数の文字に含まれる各文字の各々の文字に関して、これまでに選択した選択単語の列で構成される文字列に含まれる当該文字の出現回数と、前記第1のデータが表す複数の文字に含まれる当該文字の出現回数とが一致するまで、繰り返し、
前記繰り返しの終了後、これまでに選択した選択単語の列で構成される文字列に関するデータを前記第2のデータとして生成し、
前記制約条件には、
これまでに選択した選択単語の列で構成される文字列を構成する文字の並びの尤もらしさに関する第1の条件と、
前記第1のデータが表す複数の文字に含まれる各文字の各々の文字に関して、これまでに選択した選択単語の列で構成される文字列に含まれる当該文字の出現回数が、前記第1のデータが表す複数の文字に含まれる当該文字の出現回数以下であることを表す第2の条件、が含まれる、ことを特徴とする生成方法。 - コンピュータを、請求項1乃至4の何れか一項に記載の生成装置における各手段として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019037605A JP7298192B2 (ja) | 2019-03-01 | 2019-03-01 | 生成装置、生成方法及びプログラム |
US17/435,002 US20220138434A1 (en) | 2019-03-01 | 2020-02-21 | Generation apparatus, generation method and program |
PCT/JP2020/007211 WO2020179519A1 (ja) | 2019-03-01 | 2020-02-21 | 生成装置、生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019037605A JP7298192B2 (ja) | 2019-03-01 | 2019-03-01 | 生成装置、生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020140627A JP2020140627A (ja) | 2020-09-03 |
JP7298192B2 true JP7298192B2 (ja) | 2023-06-27 |
Family
ID=72264975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019037605A Active JP7298192B2 (ja) | 2019-03-01 | 2019-03-01 | 生成装置、生成方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220138434A1 (ja) |
JP (1) | JP7298192B2 (ja) |
WO (1) | WO2020179519A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009059138A (ja) | 2007-08-31 | 2009-03-19 | Seiko Instruments Inc | 単語検索装置、方法及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10431210B1 (en) * | 2018-04-16 | 2019-10-01 | International Business Machines Corporation | Implementing a whole sentence recurrent neural network language model for natural language processing |
-
2019
- 2019-03-01 JP JP2019037605A patent/JP7298192B2/ja active Active
-
2020
- 2020-02-21 WO PCT/JP2020/007211 patent/WO2020179519A1/ja active Application Filing
- 2020-02-21 US US17/435,002 patent/US20220138434A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009059138A (ja) | 2007-08-31 | 2009-03-19 | Seiko Instruments Inc | 単語検索装置、方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
小野 智司 外3名,進化計算法を用いたアナグラム文の生成,第90回 知識ベースシステム研究会資料 (SIG-KBS-B001) ,日本,社団法人人工知能学会,2010年10月07日,pp. 17-22 |
鈴木 啓輔 外2名,文節データベースを用いた日本語アナグラムの自動生成,FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文,日本,一般社団法人情報処理学会 社団法人電子情報通信学会,2011年08月22日,pp.97-102 |
Also Published As
Publication number | Publication date |
---|---|
WO2020179519A1 (ja) | 2020-09-10 |
US20220138434A1 (en) | 2022-05-05 |
JP2020140627A (ja) | 2020-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
JP2001249920A (ja) | 推測入力源からのテキストに対して候補を提供する方法およびシステム | |
JP2022047291A (ja) | 情報処理装置、方法、及びプログラム | |
JP2003196280A (ja) | テキスト生成方法及びテキスト生成装置 | |
JP7230576B2 (ja) | 生成装置、学習装置、生成方法及びプログラム | |
JP5235918B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
US12050867B2 (en) | Language model based writing aid method, device and system | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
US20200279024A1 (en) | Non-transitory computer readable medium | |
JP7298192B2 (ja) | 生成装置、生成方法及びプログラム | |
JP2013134753A (ja) | 誤り文修正装置、誤り文修正方法およびプログラム | |
Mammadov et al. | Part-of-speech tagging for azerbaijani language | |
WO2018179729A1 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP6325789B2 (ja) | 翻訳装置及び翻訳プログラム | |
JP4341077B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
WO2014030258A1 (ja) | 形態素解析装置、テキスト分析方法、及びそのプログラム | |
Mokhtarabadi et al. | FarsInstruct: Empowering Large Language Models for Persian Instruction Understanding | |
Islam et al. | Enhancing Bangla Language Next Word Prediction and Sentence Completion through Extended RNN with Bi-LSTM Model On N-gram Language | |
JP3961858B2 (ja) | 翻字装置及びそのプログラム | |
WO2011118428A1 (ja) | 要求獲得システム、要求獲得方法、及び要求獲得用プログラム | |
JP4049141B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム | |
JP7200474B2 (ja) | 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム | |
JP2003132052A (ja) | 読みがな付与装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230412 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230412 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7298192 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |