JP7094121B2 - 文章のドメイン判断方法及び装置 - Google Patents
文章のドメイン判断方法及び装置 Download PDFInfo
- Publication number
- JP7094121B2 JP7094121B2 JP2018042977A JP2018042977A JP7094121B2 JP 7094121 B2 JP7094121 B2 JP 7094121B2 JP 2018042977 A JP2018042977 A JP 2018042977A JP 2018042977 A JP2018042977 A JP 2018042977A JP 7094121 B2 JP7094121 B2 JP 7094121B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- domain
- embedded
- autoencoder
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000012549 training Methods 0.000 claims description 87
- 238000013459 approach Methods 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 206010019280 Heart failures Diseases 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 206010003119 arrhythmia Diseases 0.000 description 2
- 230000006793 arrhythmia Effects 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
202 オートエンコーダ
203 入力文章
204 入力特徴
205 埋め込み特徴
701 オートエンコーダ
702 複数のドメイン文章
703 複数の非ドメイン文章
704 複数の第1トレーニング特徴
705 複数の第2トレーニング特徴
706 複数の第1埋め込み特徴
707 複数の再構成エラー
708 複数の第2埋め込み特徴
Claims (19)
- 文章のドメイン判断方法であって、
ドメイン判断装置によって、オートエンコーダを用いて入力文章を表現している入力特徴から埋め込み特徴を生成するステップと、
前記ドメイン判断装置によって、複数の埋め込み特徴が分布している埋め込み空間上で、前記埋め込み特徴の位置に基づいて前記入力文章のドメインを判断するステップと、
を含み、
前記判断するステップは、前記埋め込み特徴の位置と予め定義された位置との間の距離に基づいて、前記入力文章がドメイン文章又は非ドメイン文章のいずれであるかを判断するステップを含み、
前記オートエンコーダは、複数の非ドメイン文章を表現している複数の特徴から生成された複数の埋め込み特徴が前記予め定義された位置に近づくように学習され、
前記判断するステップは、さらに、前記距離が閾値距離よりも小さい場合、前記入力文章が前記非ドメイン文章であると判断するステップを含む、
方法。 - 文章のドメイン判断方法であって、
ドメイン判断装置によって、オートエンコーダを用いて入力文章を表現している入力特徴から埋め込み特徴を生成するステップと、
前記ドメイン判断装置によって、複数の埋め込み特徴が分布している埋め込み空間上で、前記埋め込み特徴の位置に基づいて前記入力文章のドメインを判断するステップと、
を含み、
前記判断するステップは、前記埋め込み特徴の位置と予め定義された位置との間の距離に基づいて、前記入力文章がドメイン文章又は非ドメイン文章のいずれであるかを判断するステップを含み、
前記オートエンコーダは、複数のドメイン文章を表現している複数の特徴から生成された複数の埋め込み特徴が前記予め定義された位置に近づくように学習され、
前記判断するステップは、前記距離が閾値距離よりも大きい場合、前記入力文章が前記非ドメイン文章であると判断するステップを含み、
前記判断するステップは、
前記距離が前記閾値距離よりも小さい場合、前記オートエンコーダを用いて前記埋め込み特徴から再構成特徴を生成するステップと、
前記入力特徴と前記再構成特徴に基づいて再構成エラーを生成するステップと、
前記再構成エラーが閾値エラーよりも小さい場合、前記入力文章が前記非ドメイン文章であると判断するステップと、
を含む、
方法。 - 前記判断するステップは、
前記距離が前記閾値距離よりも大きい場合、前記オートエンコーダを用いて前記埋め込み特徴から再構成特徴を生成するステップと、
前記入力特徴と前記再構成特徴に基づいて再構成エラーを生成するステップと、
前記再構成エラーが閾値エラーよりも大きい場合、前記入力文章が前記非ドメイン文章であると判断するステップと、
を含む、請求項1に記載の方法。 - 前記予め定義された位置は前記埋め込み空間上の原点である、
請求項1ないし3のうちいずれか一項に記載の方法。 - 前記判断するステップは、
前記埋め込み特徴の位置及び前記予め定義された位置に基づいて、Lp-norm又はKL-divergence(Kullback-Leibler divergence:KLD)を算出するステップと、
前記算出の結果に基づいて、前記埋め込み特徴の位置及び前記予め定義された位置の間の距離を生成するステップと、
を含む、請求項1ないし3のうちいずれか一項に記載の方法。 - 前記判断するステップは、
前記オートエンコーダを用いて、前記埋め込み特徴から再構成特徴を生成するステップと、
前記入力特徴と前記再構成特徴に基づいて再構成エラーを生成するステップと、
前記再構成エラー及び前記位置に基づいて前記入力文章のドメインを判断するステップと、
を含む、請求項1ないし5のうちいずれか一項に記載の方法。 - 前記埋め込み特徴は、前記オートエンコーダ内の隠しレイヤの活性化値又は事前-活性化値である、
請求項1ないし5のうちいずれか一項に記載の方法。 - 前記入力特徴は、前記入力文章からニューラルネットワークによって生成された埋め込み特徴である、
請求項1ないし7のうちいずれか一項に記載の方法。 - 前記入力特徴は、前記オートエンコーダ内の入力レイヤに対応するワンホットベクトル、実数ベクトル、及び関数のうち少なくとも1つ又はその組み合わせを含む、
請求項1ないし7のうちいずれか一項に記載の方法。 - 前記再構成特徴は、前記オートエンコーダ内の出力レイヤに対応するワンホットベクトル、実数ベクトル、及び関数のうち少なくとも1つ又はその組み合わせを含む、
請求項2に記載の方法。 - 前記判断するステップは、予め定義された複数のドメインにそれぞれ対応する予め定義された位置と、前記位置に基づいて前記ドメインのうち前記入力文章が属するドメインを判断するステップを含む、
請求項1に記載の方法。 - 前記オートエンコーダは、前記ドメインにそれぞれ属する複数のドメイン文章を表現している複数の特徴から生成された複数の埋め込み特徴が前記位置にそれぞれ近づくように学習され、
前記入力文章が属するドメインを判断するステップは、
前記位置のうち前記位置と最も近い第2位置を識別するステップと、
前記位置と前記第2位置の間の距離が閾値距離よりも小さいか否かに基づいて、前記入力文章が前記第2位置に対応する第2ドメインに属するものと判断するステップと、
を含む、請求項11に記載の方法。 - 前記入力文章が前記第2ドメインに属するものと判断するステップは、
前記距離が前記閾値距離よりも小さい場合、前記オートエンコーダを用いて前記埋め込み特徴から再構成特徴を生成するステップと、
前記入力特徴と前記再構成特徴に基づいて再構成エラーを生成するステップと、
前記再構成エラーが閾値エラーよりも小さい場合、前記入力文章が非ドメイン文章(前記非ドメイン文章は、前記ドメインに属しない文章である)であるものと判断するステップと、
を含む、請求項12に記載の方法。 - 文章のドメイン判断のための学習方法であって、
トレーニング文章を表現しているトレーニング特徴をオートエンコーダに印加するステップであり、前記オートエンコーダは前記トレーニング特徴から埋め込み特徴を生成するように構成されている、ステップと、
前記トレーニング特徴から生成された前記埋め込み特徴の位置が埋め込み空間上の予め定義された位置に近づくように前記オートエンコーダを学習させるステップであり、前記埋め込み空間には、複数の埋め込み特徴が分布する、ステップと、
を含み、
前記オートエンコーダに印加するステップは、
ドメイン文章を表現している第1トレーニング特徴を前記オートエンコーダに印加するステップと、
非ドメイン文章を表現している第2トレーニング特徴を前記オートエンコーダに印加するステップと、
を含み、
前記オートエンコーダを学習させるステップは、
前記第1トレーニング特徴から生成された第1埋め込み特徴を取得するステップと、
前記第1埋め込み特徴から生成された再構成特徴と前記第1トレーニング特徴との間の再構成エラーが小さくなるように前記オートエンコーダを学習させるステップと、
前記第2トレーニング特徴から生成された第2埋め込み特徴の位置が前記埋め込み空間上の第2位置に近づくように前記オートエンコーダを学習させるステップと、
を含む、
方法。 - 文章のドメイン判断のための学習方法であって、
トレーニング文章を表現しているトレーニング特徴をオートエンコーダに印加するステップであり、前記オートエンコーダは前記トレーニング特徴から埋め込み特徴を生成するように構成されている、ステップと、
前記トレーニング特徴から生成された前記埋め込み特徴の位置が埋め込み空間上の予め定義された位置に近づくように前記オートエンコーダを学習させるステップであり、前記埋め込み空間には、複数の埋め込み特徴が分布する、ステップと、
を含み、
前記オートエンコーダに印加するステップは、
ドメイン文章を表現している第1トレーニング特徴を前記オートエンコーダに印加するステップと、
非ドメイン文章を表現している第2トレーニング特徴を前記オートエンコーダに印加するステップと、
を含み、
前記オートエンコーダを学習させるステップは、
前記第1トレーニング特徴から生成された第1埋め込み特徴の位置が前記埋め込み空間上の第1位置に近づくように前記オートエンコーダを学習させるステップと、
前記第2トレーニング特徴から生成された第2埋め込み特徴を取得するステップと、
前記第2埋め込み特徴から生成された再構成特徴と前記第2トレーニング特徴との間の再構成エラーが小さくなるように前記オートエンコーダを学習させるステップと、
を含む、
方法。 - 文章のドメイン判断のための学習方法であって、
トレーニング文章を表現しているトレーニング特徴をオートエンコーダに印加するステップであり、前記オートエンコーダは前記トレーニング特徴から埋め込み特徴を生成するように構成されている、ステップと、
前記トレーニング特徴から生成された前記埋め込み特徴の位置が埋め込み空間上の予め定義された位置に近づくように前記オートエンコーダを学習させるステップであり、前記埋め込み空間には、複数の埋め込み特徴が分布する、ステップと、
を含み、
前記オートエンコーダに印加するステップは、
第1ドメイン文章を表現している第1トレーニング特徴を前記オートエンコーダに印加するステップと、
第2ドメイン文章を表現している第2トレーニング特徴を前記オートエンコーダに印加するステップと、
非ドメイン文章を表現している第3トレーニング特徴を前記オートエンコーダに印加するステップであり、前記非ドメイン文章は、複数のドメインに属しない文章である、ステップと、
を含み、
前記オートエンコーダを学習させるステップは、
前記第1トレーニング特徴から生成された第1埋め込み特徴の位置が前記埋め込み空間上の第1位置に近づくように前記オートエンコーダを学習させるステップと、
前記第2トレーニング特徴から生成された第2埋め込み特徴の位置が前記埋め込み空間上の第2位置に近づくように前記オートエンコーダを学習させるステップと、
前記第3トレーニング特徴から生成された第3埋め込み特徴を取得するステップと、
前記第3埋め込み特徴から生成された再構成特徴と前記第3トレーニング特徴との間の再構成エラーが小さくなるように前記オートエンコーダを学習させるステップと、
を含む、
方法。 - ハードウェアと結合して請求項1ないし請求項16のうちいずれか一項に記載の方法を実行させるために記録媒体に格納されたコンピュータプログラム。
- 文章のドメイン判断装置であって、
プロセッサ、を含み、
請求項1ないし請求項13のうちいずれか一項に記載の方法を実行させる、
装置。 - 文章のドメイン判断のための学習装置であって、
プロセッサ、を含み、
請求項14ないし請求項16のうちいずれか一項に記載の方法を実行させる、
装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2017-0102960 | 2017-08-14 | ||
KR1020170102960A KR102410825B1 (ko) | 2017-08-14 | 2017-08-14 | 문장의 도메인 판단 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019036286A JP2019036286A (ja) | 2019-03-07 |
JP7094121B2 true JP7094121B2 (ja) | 2022-07-01 |
Family
ID=60923287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018042977A Active JP7094121B2 (ja) | 2017-08-14 | 2018-03-09 | 文章のドメイン判断方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10528666B2 (ja) |
EP (1) | EP3444726A1 (ja) |
JP (1) | JP7094121B2 (ja) |
KR (1) | KR102410825B1 (ja) |
CN (1) | CN109388797B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11023683B2 (en) * | 2019-03-06 | 2021-06-01 | International Business Machines Corporation | Out-of-domain sentence detection |
KR102264899B1 (ko) * | 2019-03-15 | 2021-06-11 | 에스케이텔레콤 주식회사 | 자연어 처리 시스템, 그 학습 방법 및 프로그램이 기록된 컴퓨터 판독가능한 기록매체 |
US11443137B2 (en) | 2019-07-31 | 2022-09-13 | Rohde & Schwarz Gmbh & Co. Kg | Method and apparatus for detecting signal features |
CN110688446B (zh) * | 2019-08-23 | 2023-04-14 | 重庆兆光科技股份有限公司 | 一种句义数学空间表示方法、系统、介质和设备 |
CN110807332B (zh) * | 2019-10-30 | 2024-02-27 | 腾讯科技(深圳)有限公司 | 语义理解模型的训练方法、语义处理方法、装置及存储介质 |
KR102358485B1 (ko) * | 2019-10-30 | 2022-02-04 | 주식회사 솔트룩스 | 도메인 자동 분류 대화 시스템 |
KR102579293B1 (ko) * | 2021-03-16 | 2023-09-18 | 주식회사 웨이센 | 복수 의미 유형 단어의 단일 의미 유형 단어로의 라벨링 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009528627A (ja) | 2006-02-27 | 2009-08-06 | マイクロソフト コーポレーション | 伝搬されるドキュメントの関連性を用いたランキング機能のトレーニング |
JP2014112283A (ja) | 2012-12-05 | 2014-06-19 | Docomo Technology Inc | 情報処理装置、情報処理方法、およびプログラム |
CN105488151A (zh) | 2015-11-27 | 2016-04-13 | 小米科技有限责任公司 | 参考文档的推荐方法及装置 |
JP2017054214A (ja) | 2015-09-07 | 2017-03-16 | ヤフー株式会社 | 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム |
US20180101534A1 (en) | 2016-10-12 | 2018-04-12 | Salesforce.Com, Inc. | Accounting for Positional Bias in A Document Retrieval System Using Machine Learning |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000046701A1 (en) * | 1999-02-08 | 2000-08-10 | Huntsman Ici Chemicals Llc | Method for retrieving semantically distant analogies |
JP2004198597A (ja) * | 2002-12-17 | 2004-07-15 | Advanced Telecommunication Research Institute International | 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体 |
PL2639749T3 (pl) | 2012-03-15 | 2017-05-31 | Cortical.Io Gmbh | Sposoby, urządzenia i produkty do przetwarzania semantycznego tekstu |
KR101309042B1 (ko) | 2012-09-17 | 2013-09-16 | 포항공과대학교 산학협력단 | 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법 |
KR20140138011A (ko) | 2013-05-24 | 2014-12-03 | 삼성전자주식회사 | 음성 인식 장치 및 그 제어 방법 |
CN103902655B (zh) * | 2014-02-28 | 2017-01-04 | 小米科技有限责任公司 | 聚类方法、装置及终端设备 |
US10181098B2 (en) * | 2014-06-06 | 2019-01-15 | Google Llc | Generating representations of input sequences using neural networks |
US20160055240A1 (en) | 2014-08-22 | 2016-02-25 | Microsoft Corporation | Orphaned utterance detection system and method |
CN105824797B (zh) * | 2015-01-04 | 2019-11-12 | 华为技术有限公司 | 一种评价语义相似度的方法、装置和系统 |
US9842105B2 (en) * | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US9990361B2 (en) * | 2015-10-08 | 2018-06-05 | Facebook, Inc. | Language independent representations |
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN106897270B (zh) * | 2017-03-10 | 2020-01-24 | 吉林大学 | 一种文本中知识领域识别方法及系统 |
US10380259B2 (en) * | 2017-05-22 | 2019-08-13 | International Business Machines Corporation | Deep embedding for natural language content based on semantic dependencies |
-
2017
- 2017-08-14 KR KR1020170102960A patent/KR102410825B1/ko active IP Right Grant
- 2017-11-28 US US15/824,743 patent/US10528666B2/en active Active
- 2017-12-20 EP EP17208856.9A patent/EP3444726A1/en not_active Ceased
-
2018
- 2018-03-09 JP JP2018042977A patent/JP7094121B2/ja active Active
- 2018-04-04 CN CN201810295802.8A patent/CN109388797B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009528627A (ja) | 2006-02-27 | 2009-08-06 | マイクロソフト コーポレーション | 伝搬されるドキュメントの関連性を用いたランキング機能のトレーニング |
JP2014112283A (ja) | 2012-12-05 | 2014-06-19 | Docomo Technology Inc | 情報処理装置、情報処理方法、およびプログラム |
JP2017054214A (ja) | 2015-09-07 | 2017-03-16 | ヤフー株式会社 | 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム |
CN105488151A (zh) | 2015-11-27 | 2016-04-13 | 小米科技有限责任公司 | 参考文档的推荐方法及装置 |
US20180101534A1 (en) | 2016-10-12 | 2018-04-12 | Salesforce.Com, Inc. | Accounting for Positional Bias in A Document Retrieval System Using Machine Learning |
Also Published As
Publication number | Publication date |
---|---|
JP2019036286A (ja) | 2019-03-07 |
EP3444726A1 (en) | 2019-02-20 |
CN109388797A (zh) | 2019-02-26 |
CN109388797B (zh) | 2024-02-02 |
US20190050395A1 (en) | 2019-02-14 |
KR102410825B1 (ko) | 2022-06-20 |
KR20190018246A (ko) | 2019-02-22 |
US10528666B2 (en) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7094121B2 (ja) | 文章のドメイン判断方法及び装置 | |
US10460726B2 (en) | Language processing method and apparatus | |
KR102589638B1 (ko) | 문장 생성 장치 및 방법 | |
US10949625B2 (en) | Machine translation method and apparatus | |
US11901047B2 (en) | Medical visual question answering | |
US10714077B2 (en) | Apparatus and method of acoustic score calculation and speech recognition using deep neural networks | |
US11468324B2 (en) | Method and apparatus with model training and/or sequence recognition | |
US20200192985A1 (en) | Method and apparatus with machine translation | |
CN111192576B (zh) | 解码方法、语音识别设备和系统 | |
US12100392B2 (en) | Decoding method and apparatus in artificial neural network for speech recognition | |
US20210109752A1 (en) | Natural language processing method and apparatus | |
Singh et al. | HINDIA: a deep-learning-based model for spell-checking of Hindi language | |
US12039277B2 (en) | Method and device with natural language processing | |
EP3910625A2 (en) | Method and apparatus for utterance time estimation | |
KR20200132619A (ko) | 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 | |
US20230237993A1 (en) | Systems and Methods for Training Dual-Mode Machine-Learned Speech Recognition Models | |
US11341413B2 (en) | Leveraging class information to initialize a neural network language model | |
JP2023545994A (ja) | 敵対的攻撃を防ぐための質問回答対話システムのトレーニング | |
US11244166B2 (en) | Intelligent performance rating | |
Cai et al. | Multimodal Approaches for Alzheimer’s Detection Using Patients’ Speech and Transcript | |
US12073825B2 (en) | Method and apparatus for speech recognition | |
CN113066510B (zh) | 一种元音弱读检测方法及装置 | |
Xia et al. | Sequence generation with target attention | |
KR102413050B1 (ko) | 문서 요약 방법 및 장치 | |
Li et al. | Attention-based recurrent neural network for sequence labeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7094121 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |