JP2007317211A - モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 - Google Patents
モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 Download PDFInfo
- Publication number
- JP2007317211A JP2007317211A JP2007174038A JP2007174038A JP2007317211A JP 2007317211 A JP2007317211 A JP 2007317211A JP 2007174038 A JP2007174038 A JP 2007174038A JP 2007174038 A JP2007174038 A JP 2007174038A JP 2007317211 A JP2007317211 A JP 2007317211A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- morpheme
- syntax
- storage means
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Abstract
【解決手段】構文分析方法及び自然語検索方法は、文法規則データベースと、助詞と語尾を共に統語の単位として取り扱う標識理論に基づいて用言語尾の統語的地位を認定し、語彙間の統合関係が完全に文法的に規定され得るように、文章の各構成成分の語幹及び語尾など中心語が有する下位範疇の内訳が格納される下位範疇化データベースとを構築し、入力された文章を形態素分析段階と、分析された形態素を文法規則データベースに格納された文法的規則によって文章の部分的な構造をまず確立し、前記下位範疇化データベースを用いて全体的な構造を確立し、各構造の加重値を計算して、最も適した最適例を確定して出力する構文分析段階と、を備えてなる。
【選択図】図1
Description
言い換えれば、自然言語処理方法の開発は、コンピュータに話を教えることであると要約することができ、このような既存の構文分析は、確率基盤的方式を使用している。
特に、このような従来の確率基盤的な構文分析方法を韓国語に適用した韓国語文法モデルは、大きく、崔鉉培(1937)による伝統的モデルと、チョムスキー(Chomsky、1965)などによる生成文法的モデルとに分けられる。
このような両分枝構造(binary structure)を説明すれば、仮に「Naneun Kongwoneso Youngheereul mannata(S)(私は公園で英姫に会った)」という構文を分析する時、文章を構成するあらゆる単位が2つずつ対になって文章を構成するものであって、「Naneun (NP) 」と「Kongwoneso Youngheereul mannata (VP) 」とに区分し、VPをさらに「Kongwoneso (PP) 」と「Youngheereul mannata (V′) 」とに区分し、V′をさらに「Youngheereul (NP) 」と「mannata (V) 」とに区分する支配関係と先行関係が1つの規則の中で同時に定義される方式である。すなわち、主語は、Sに直接支配を受けるNPであり、場所は、VPに直接支配を受けるPPであり、直接目的語は、V′に直接的に支配を受けるNPであり、このように2次的に文法的機能が定義される。
すなわち、韓国語のような自由語順言語の場合はもちろん、固定語順言語として知られた英語の場合にも、前置詞句は、語順倒置が非常に自由なので、このような語順倒置は、形状的位置によって文法的機能が決定されることができないことを示す。
特に、このような自由語順に対する対処能力は、文語資料とは異なって、成分の頻繁な省略と位置変化がある口語体資料の処理において非常に重要であるが、従来の両分枝構造は、このような資料を完璧に処理することはできなかった。
特に、このような従来の構文分析方法は、構成成分の活用される形態によって文法的機能を定義する活用概念によるもので、このような活用概念によれば、
1B.Cheolsooneunhaggyoe ganeun Youngheereul boatta.(哲秀は学校に行く英姫を見た)
さらに、従来の構文分析による既存の自然語検索エンジンは、低い水準の形態素分析だけを用いたり、語節単位の索引方式を使用することによって、各々の語節が含んでいる文法的関係を捕捉できず、ただ確率基盤的接近によって検索が行われ、ただ頻度数が高いゴミ情報が多量で検出され、核心的な結果を検索することが難しかった。
2B.[Cheolsoo - neun [haggyo - e ga] - neun Younghee - reul bo] - at - ta .
@root bab (ご飯)
@pos nc
@type concrete
@subtype food
@property solid
......
@root haggyo (学校)
@pos nc
@type concrete|abstract
@subtype organization
......
jc <- e/jc dae/nx - ha/xsv - eoseo/ec
......
jc <- wa/jc gad/pa - i/xsa
......
pv <- */nc-*/xsv
pv <- */nx-*/xsv
nc <- */nc-*/nx
......
ep <- ??/etm - geod/nb - i/co
{ep:tense=[fut];ep:origin = [cep];}
......
N' <- NPm N' <5>
[NPm:nbval;]
{N':type = N'#1:type;
N':subtype = N'#1:subtype;
N':property = N'#1:property;}
......
ADVP <- mag ADVP-s <4>
[s:lex == [,]; mag:subtype ** [degree];]
{ADVP:subtype = ADVP#1:subtype;}
......
meog NP(subtype ~= [human|animal]; jcval *= < i >)[c_sbj]
NP(type ~= [concrete]; subtype~=[food|medicine|abstract|fuel]; jcval *= < eul
>)[c_obj]
{A_Type1}
pv
......
meogi NP(jcval *= < i >; !!(nbval); type ~= [alive])[c_sbj]
NP(jcval *= < ege >; type ~= [alive])[c_dat]
NP(jcval *= < eul>; subtype ~= [food|liquid])[c_obj]
{A_Type1}
pv
......
#BOAT
A_Type1
ADVP(subtype ** [manner])[a_manner]
ADVP(subtype ** [time])[a_temp]
ADVP(subtype ** [motive])[a_reason]
...
NP(subtype ** [time]; !!(jcval) && nbval)[a_occurrence]
NP(subtype ~=[place|space|spot]; jcval**< eseo >)[a_loc]
NP(type ** [concrete]; jcval**< ro >)[a_instr]
...
VPn(etnval == [ gi ]; jcval == [ e ])[a_motive]
VPf(mood ~= [declarative]; jcval == [ go ])[a_reason]
A_Type2
......
A_Type3
......
......
#BOAT
参考として、図6の中段「全体索引量」窓には、前記文書分析段階で予め分析された文書の個数が「47件」、文章の個数が「92件」、単語の個数が「257件」であることを示す。
ここで、前記文書検索段階S130は、検索者の選択によって(S140)、特別検索規則情報11と名詞体系データベース12により特別検索モードのための条件を発生させる特別検索モード条件生成段階S150を進行したり、辞書データベース13を一般検索する一般検索モード条件生成段階S160を進行することができる。
このような一般検索モードは、与えられた質疑語の直接構成成分と一致する資料を抽出して提供する成分一致検索方法と、質疑語を構成する成分を含むものの、核語である述語と意味的に類似の述語を含む資料を抽出して提供する意味一致検索方法を使用することができる。
すなわち、このような特別検索モードのためには、前記特別検索規則情報11と名詞体系データベース12のような名詞の意味的位階構造に対するデータベースが使われる。
すなわち、図9及び図10に示すように、1番文書で1番目の文章「Youngheeneun Cheolsooreul joahanda」、23番目の文章「Youngheeneun Cheolsooreul joahanda」、60番目の文章「YoungheeneunCheolsooreul joahanda」が検索された。
本発明は、前述の実施例に限定されるものではなく、本発明の技術的思想を逸脱しない範囲内で、様々な置換、変形及び変更が可能である。
例えば、本発明の実施例では、韓国語にだけ限定されているが、助詞や語尾の重要性が高い日本語など他の国の言語にも適用されることができ、構文分析機を用いた自然語検索システムはもちろん、ヤフーなどのポータルサイトの検索エンジンや、人工知能コンピュータの質問、応答システムなど、コンピュータが人間の言語を理解することができるあらゆる分野に適用されることができる。
従って、本発明の範囲は、上述した実施例及び添付された図面に限定されるものではなく、特許請求範囲の範囲と本発明の技術的思想により限定されるだろう。
Claims (7)
- 入力された文章の形態素を分析する形態素分析手段と、文法規則が格納される文法規則データベース記憶手段と、助詞と語尾を共に統語の単位として取り扱う標識理論に基づいて用言語尾の統語的地位を認定し、語彙間の統合関係が完全に文法的に規定され得るように、文章の各構成成分の語幹及び語尾を含む中心語が有する下位範疇の内訳が格納される下位範疇化データベース記憶手段と、を少なくとも具備してなるコンピュータによって構文を分析して構文の文法的機能を明示する、構文分析方法であって、
(a)文章入力手段が、文章を入力するステップと、
(b)前記形態素分析手段が、前記文章入力手段が入力した文章を分析して形態素を取得するステップと、
(c)部分構造確立手段が、形態素分析手段が取得した形態素から、前記文法規則データベース記憶手段に記憶されている文法規則を参照して形態素からなる部分構造を確立するステップと、
(d)全体構造確立手段が、部分構造確立手段が確立した部分構造から、前記下位範疇化データベース記憶手段に記憶されている下位範疇の内訳を参照して形態素からなる全体構造を確立するステップと、
(e)前記全体構造の各々の加重値を計算するステップと、
(f)選択手段が、前記加重値に基づいて全体構造を選択して構文分析結果として出力するステップとを有することを特徴とするモビール形状概念を基礎にした構文分析方法。 - 前記コンピュータは更に、多重形態素目録記憶手段と、意味属性辞書記憶手段と、付加詞類型データベース記憶手段と、を具備し、
前記ステップ(c)の前処理として、
(g)多重形態素変換手段が、前記多重形態素目録記憶手段を参照して多重形態素目録に含まれる構文が存在するか否かを判断して、多重形態素構文が存在すれば、多重形態素形態に変換するステップと、
(h)意味属性付与手段が、前記意味属性辞書記憶手段を参照して、単語が意味する意味を判断して、形態素に意味属性品詞を付与するステップとを有し、
さらに、前記部分構造確立手段が、意味属性品詞が付与された形態素が入力されれば、個別形態素として処理し、文法規則データベースに格納された文法的規則によって、選択された形態素に局部構造規則が適用されるか否かを判断して、局部的な構造を形成し、後続処理対象を参照し、再帰的局部構造が形成されるか否かを判断して、内部構造を確立し、他の内部構造がなければ、次のプロセスを反復し、
さらに、前記全体構造確立手段が、前記下位範疇化データベース記憶手段に記憶されている下位範疇の内訳及び付加詞類型データベース記憶手段に記憶されている付加詞類型を基準にして構文のカテゴリーと修飾形態によって全体構造を確立し、
前記計算手段が、構文の位置又は構文の性格を基準にして各構造の加重値を計算し、
前記選択手段が、最も重要な構造を選択して最適例を選択し、選択した最適例の全体構造と各々の部分構造及び各形態素間の関係が互いに対をなして連結されるように、モビール型連結線で表示する、請求項1に記載のモビール形状概念を基礎にした構文分析方法。 - 前記意味属性付与手段が、前記意味属性辞書記憶手段を参照して、形態素の統語特性と意味情報を確定する要素であって、複文構造において構造的重義性を低減するに寄与し、用言別付加詞目録を確定するように、一般名詞など単語が意味する意味とそれらに対する分類を類型別に実行するものであり、
前記多重形態素変換手段が、前記多重形態素目録記憶手段を参照して、互いに同じ形態の助詞又は助詞の機能を有する接尾辞などに対する語彙的な特徴を分類するために、区別のための分類を類型別に実行するものであり、
前記文法規則データベース記憶手段は、各基本素に対する文法的な規則を規定する情報を格納するものであり、前記下位範疇化データベース記憶手段は、用言が取ることができる成分の内訳及び変形可能な用言語尾の形態に関する情報を格納するものであり、
前記付加詞類型データベース記憶手段は、多分枝構造の重義性を決定する要素であって、核語により統合され得る局部構造の類型を決定する助詞又は語尾或いはこれらと類似の機能を有する接尾辞などの一般的な特徴に関する情報を格納するものである、請求項2に記載のモビール形状概念を基礎にした構文分析方法。 - 請求項1乃至3の何れかに記載のモビール形状概念を基礎にした構文分析方法を用い、自然語質疑語を入力して文章を検索する自然語検索方法において、
文書分析手段が、前記コンピュータに分析すべき文章が入力されれば、前記モビール形状概念を基礎にした構文分析方法により、検索対象となる文書の文章分析情報を文章情報データベースに格納するステップと、
質疑語構文分析手段が、前記文書情報データベースにおいて所望の情報を質問する自然語形態の質疑語が入力されれば、前記モビール形状概念を基礎にした構文分析方法により、質疑語の構文をまず分析し、分析された構文分析結果を構文情報により単語別に解剖し、質疑語の疑問文の形態を把握して、解剖した細部質疑語を確定するステップと、
文書検索手段が、前記文章分析辞書で確定した前記細部質疑語のタグを所望の疑問文の形態によって検索用タグに役目を変換し、変換した検索用タグを有する単語を前記文章分析辞書から検索し、検索した回数を基準にして順位を計算するステップと、
表示手段が、検索した単語と検索用タグを含む文章及びその文章が含まれた文書に関する内容を表示するステップと、
からなることを特徴とする、
モビール形状概念を基礎にした構文分析方法を用いた自然語検索方法。 - 前記コンピュータは更に、辞書データベース記憶手段と、特別検索規則情報記憶手段と、名詞体系データベース記憶手段と、を具備し、
前記文書検索手段は、
構文分析した情報だけを用いて質疑語の構文分析結果だけを基盤にして既分析された前記辞書データベース記憶手段を検索して、一致する内容を抽出し提供する一般検索ステップと、
質疑語に特定の表現が含まれる場合、検索者の選択によって前記特別検索規則情報記憶手段及び前記名詞体系データベース記憶手段を参照して特別検索モードのための条件を生成させ、これを基盤にして意味的に与えられた成分に従属した内容を検索して提供する特別検索ステップと、を実行してなり、
前記一般検索ステップは、与えられた質疑語の直接構成成分と一致する資料を抽出して提供する成分一致検索方法と、質疑語を構成する成分を含むものの、核語である述語と意味的に類似の述語を含む資料を抽出して提供する意味一致検索方法により行われ、
前記特別検索ステップは、前記特別検索規則情報記憶手段に記憶されている特別検索規則情報及び名詞体系データベース記憶手段に記憶されている名詞の意味的位階構造を利用することを特徴とする請求項4に記載のモビール形状概念を基礎にした構文分析方法を用いた自然語検索方法。 - 入力された文章の形態素を分析する形態素分析手段と、文法規則が格納される文法規則データベース記憶手段と、助詞と語尾を共に統語の単位として取り扱う標識理論に基づいて用言語尾の統語的地位を認定し、語彙間の統合関係が完全に文法的に規定され得るように、文章の各構成成分の語幹及び語尾を含む中心語が有する下位範疇の内訳が格納される下位範疇化データベース記憶手段と、を少なくとも具備してなるコンピュータによって構文を分析して構文の文法的機能を明示する、構文分析装置であって、
(a)文章を入力する文章入力手段と、
(b)前記文章入力手段が入力した文章を分析して形態素を取得する前記形態素分析手段と、
(c)形態素分析手段が取得した形態素から、前記文法規則データベース記憶手段に記憶されている文法規則を参照して形態素からなる部分構造を確立する部分構造確立手段と、
(d)部分構造確立手段が確立した部分構造から、前記下位範疇化データベース記憶手段に記憶されている下位範疇の内訳を参照して形態素からなる全体構造を確立する全体構造確立手段と、
(e)前記全体構造の各々の加重値を計算する計算手段と、
(f)前記加重値に基づいて全体構造を選択して構文分析結果として出力する選択手段とを有することを特徴とするモビール形状概念を基礎にした構文分析装置。 - 入力された文章の形態素を分析する形態素分析手段と、文法規則が格納される文法規則データベース記憶手段と、助詞と語尾を共に統語の単位として取り扱う標識理論に基づいて用言語尾の統語的地位を認定し、語彙間の統合関係が完全に文法的に規定され得るように、文章の各構成成分の語幹及び語尾を含む中心語が有する下位範疇の内訳が格納される下位範疇化データベース記憶手段と、を少なくとも具備してなるコンピュータによって構文を分析して構文の文法的機能を明示する、構文分析用コンピュータプログラムであって、
コンピュータを、
(a)文章を入力する文章入力手段、
(b)前記文章入力手段が入力した文章を分析して形態素を取得する前記形態素分析手段、
(c)形態素分析手段が取得した形態素から、前記文法規則データベース記憶手段に記憶されている文法規則を参照して形態素からなる部分構造を確立する部分構造確立手段、
(d)部分構造確立手段が確立した部分構造から、前記下位範疇化データベース記憶手段に記憶されている下位範疇の内訳を参照して形態素からなる全体構造を確立する全体構造確立手段、
(e)前記全体構造の各々の加重値を計算する計算手段、
(f)前記加重値に基づいて全体構造を選択して構文分析結果として出力する選択手段として機能させることを特徴とするモビール形状概念を基礎にした構文分析用コンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2003-0025995A KR100515641B1 (ko) | 2003-04-24 | 2003-04-24 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006500677A Division JP2006524372A (ja) | 2003-04-24 | 2004-04-22 | モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007317211A true JP2007317211A (ja) | 2007-12-06 |
Family
ID=36766677
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006500677A Pending JP2006524372A (ja) | 2003-04-24 | 2004-04-22 | モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 |
JP2007174038A Pending JP2007317211A (ja) | 2003-04-24 | 2007-07-02 | モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006500677A Pending JP2006524372A (ja) | 2003-04-24 | 2004-04-22 | モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20070010990A1 (ja) |
EP (1) | EP1616270A4 (ja) |
JP (2) | JP2006524372A (ja) |
KR (1) | KR100515641B1 (ja) |
CN (1) | CN100378724C (ja) |
AU (1) | AU2004232276B2 (ja) |
CA (1) | CA2523140A1 (ja) |
HK (1) | HK1092242A1 (ja) |
WO (1) | WO2004095310A1 (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706747B2 (en) | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
GB0316806D0 (en) * | 2003-07-17 | 2003-08-20 | Ivis Group Ltd | Improved search engine |
KR100590553B1 (ko) * | 2004-05-21 | 2006-06-19 | 삼성전자주식회사 | 대화체 운율구조 생성방법 및 장치와 이를 적용한음성합성시스템 |
US8442828B2 (en) * | 2005-12-02 | 2013-05-14 | Microsoft Corporation | Conditional model for natural language understanding |
KR100717998B1 (ko) * | 2005-12-26 | 2007-05-15 | 고려대학교 산학협력단 | 문서의 표절 검사 방법 |
US7668791B2 (en) * | 2006-07-31 | 2010-02-23 | Microsoft Corporation | Distinguishing facts from opinions using a multi-stage approach |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
CN101013421B (zh) * | 2007-02-02 | 2012-06-27 | 清华大学 | 基于规则的汉语基本块自动分析方法 |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US9015194B2 (en) * | 2007-07-02 | 2015-04-21 | Verint Systems Inc. | Root cause analysis using interactive data categorization |
US8718383B2 (en) * | 2008-08-06 | 2014-05-06 | Obschestvo s ogranischennoi otvetstvennostiu “KUZNETCH” | Image and website filter using image comparison |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
KR101117427B1 (ko) * | 2009-02-26 | 2012-03-13 | 고려대학교 산학협력단 | 형태소 합성 장치 및 방법 |
KR101309839B1 (ko) * | 2009-12-02 | 2013-09-23 | 한국전자통신연구원 | 통계정보를 이용한 규칙 기반 구문분석 장치 및 방법 |
AU2011279558A1 (en) * | 2010-07-15 | 2013-03-07 | The University Of Queensland | A communications analysis system and process |
JP2012027722A (ja) * | 2010-07-23 | 2012-02-09 | Sony Corp | 情報処理装置、情報処理方法及び情報処理プログラム |
KR101850886B1 (ko) * | 2010-12-23 | 2018-04-23 | 네이버 주식회사 | 감소 질의를 추천하는 검색 시스템 및 방법 |
CN102054047B (zh) * | 2011-01-07 | 2013-03-27 | 焦点科技股份有限公司 | 一种服务可配置业务规则的提取方法 |
US10123053B2 (en) | 2011-05-23 | 2018-11-06 | Texas Instruments Incorporated | Acceleration of bypass binary symbol processing in video coding |
KR20130014106A (ko) * | 2011-07-29 | 2013-02-07 | 한국전자통신연구원 | 다중 번역 엔진을 사용한 번역 장치 및 방법 |
US9495352B1 (en) | 2011-09-24 | 2016-11-15 | Athena Ann Smyros | Natural language determiner to identify functions of a device equal to a user manual |
CN103164426B (zh) * | 2011-12-13 | 2015-10-28 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN103310343A (zh) * | 2012-03-15 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 商品信息发布方法和装置 |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
JP5526209B2 (ja) * | 2012-10-09 | 2014-06-18 | 株式会社Ubic | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム |
KR20140119841A (ko) * | 2013-03-27 | 2014-10-13 | 한국전자통신연구원 | 애니메이션을 이용한 번역 검증 방법 및 그 장치 |
US9727619B1 (en) * | 2013-05-02 | 2017-08-08 | Intelligent Language, LLC | Automated search |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
CN103927298B (zh) * | 2014-04-25 | 2016-09-21 | 秦一男 | 一种基于计算机的自然语言句法结构解析方法和装置 |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
CN108885617B (zh) * | 2016-03-23 | 2022-05-31 | 株式会社野村综合研究所 | 语句解析系统以及程序 |
US11449744B2 (en) | 2016-06-23 | 2022-09-20 | Microsoft Technology Licensing, Llc | End-to-end memory networks for contextual language understanding |
JP6784084B2 (ja) * | 2016-07-27 | 2020-11-11 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、及び検索方法 |
US10366163B2 (en) * | 2016-09-07 | 2019-07-30 | Microsoft Technology Licensing, Llc | Knowledge-guided structural attention processing |
CN109086285B (zh) * | 2017-06-14 | 2021-10-15 | 佛山辞荟源信息科技有限公司 | 基于语素的汉语智能处理方法和系统及装置 |
KR102209786B1 (ko) * | 2018-06-29 | 2021-01-29 | 김태정 | 자연어 처리 기반의 청크 구성 방법 및 장치 |
CN109388801B (zh) * | 2018-09-30 | 2023-07-14 | 创新先进技术有限公司 | 相似词集合的确定方法、装置和电子设备 |
US11416556B2 (en) * | 2019-12-19 | 2022-08-16 | Accenture Global Solutions Limited | Natural language dialogue system perturbation testing |
CN113139183B (zh) * | 2020-01-17 | 2023-12-29 | 深信服科技股份有限公司 | 一种检测方法、装置、设备及存储介质 |
CN111897914B (zh) * | 2020-07-20 | 2023-09-19 | 杭州叙简科技股份有限公司 | 用于综合管廊领域的实体信息抽取及知识图谱构建方法 |
CN113407739B (zh) * | 2021-07-14 | 2023-01-06 | 海信视像科技股份有限公司 | 信息标题中概念的确定方法、装置和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4931936A (en) * | 1987-10-26 | 1990-06-05 | Sharp Kabushiki Kaisha | Language translation system with means to distinguish between phrases and sentence and number discrminating means |
JPH02281372A (ja) * | 1989-04-24 | 1990-11-19 | Sharp Corp | 機械翻訳装置における挿入副詞句処理方法 |
JPH0635958A (ja) * | 1992-07-14 | 1994-02-10 | Hitachi Ltd | 語句検索方法 |
US6278967B1 (en) * | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
KR100331029B1 (ko) * | 1998-11-24 | 2002-09-04 | 한국전자통신연구원 | 한국어개념분류체계구축방법과,수정방법및구축장치 |
KR20000039749A (ko) * | 1998-12-15 | 2000-07-05 | 정선종 | 기계 번역을 위한 변환 장치 및 이를 이용한 변환 방법 |
JP2003030184A (ja) * | 2001-07-18 | 2003-01-31 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びにプログラムおよび記録媒体 |
-
2003
- 2003-04-24 KR KR10-2003-0025995A patent/KR100515641B1/ko not_active IP Right Cessation
-
2004
- 2004-04-22 EP EP04728982A patent/EP1616270A4/en not_active Withdrawn
- 2004-04-22 US US10/553,856 patent/US20070010990A1/en not_active Abandoned
- 2004-04-22 CN CNB2004800110557A patent/CN100378724C/zh not_active Expired - Fee Related
- 2004-04-22 WO PCT/KR2004/000927 patent/WO2004095310A1/en active IP Right Grant
- 2004-04-22 CA CA002523140A patent/CA2523140A1/en not_active Abandoned
- 2004-04-22 AU AU2004232276A patent/AU2004232276B2/en not_active Ceased
- 2004-04-22 JP JP2006500677A patent/JP2006524372A/ja active Pending
-
2006
- 2006-11-21 HK HK06112777A patent/HK1092242A1/xx not_active IP Right Cessation
-
2007
- 2007-07-02 JP JP2007174038A patent/JP2007317211A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1777888A (zh) | 2006-05-24 |
HK1092242A1 (en) | 2007-02-02 |
KR100515641B1 (ko) | 2005-09-22 |
AU2004232276B2 (en) | 2007-08-02 |
EP1616270A1 (en) | 2006-01-18 |
WO2004095310A1 (en) | 2004-11-04 |
CA2523140A1 (en) | 2004-11-04 |
AU2004232276A1 (en) | 2004-11-04 |
KR20030044949A (ko) | 2003-06-09 |
CN100378724C (zh) | 2008-04-02 |
US20070010990A1 (en) | 2007-01-11 |
EP1616270A4 (en) | 2010-05-05 |
JP2006524372A (ja) | 2006-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007317211A (ja) | モビール形状概念を基礎にした構文分析方法及びこれを用いた自然語検索方法 | |
US9710458B2 (en) | System for natural language understanding | |
Alwaneen et al. | Arabic question answering system: a survey | |
US20150081277A1 (en) | System and Method for Automatically Classifying Text using Discourse Analysis | |
Smadja et al. | Using collocations for language generation 1 | |
JP2001523019A (ja) | テキストの本文の談話構造の自動認識 | |
Mihalcea et al. | Open mind word expert: Creating large annotated data collections with web users’ help | |
US10503769B2 (en) | System for natural language understanding | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
Chiarello et al. | Product description in terms of advantages and drawbacks: Exploiting patent information in novel ways | |
Kaur et al. | A detailed analysis of core NLP for information extraction | |
Araujo | How evolutionary algorithms are applied to statistical natural language processing | |
Hosseini Pozveh et al. | FNLP‐ONT: A feasible ontology for improving NLP tasks in Persian | |
Tahayna et al. | Applying English Idiomatic Expressions to Classify Deep Sentiments in COVID-19 Tweets. | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
Vilares et al. | Extraction of complex index terms in non-English IR: A shallow parsing based approach | |
Bindu et al. | Design and development of a named entity based question answering system for Malayalam language | |
Sankaravelayuthan et al. | A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam | |
Ramos et al. | A QA System for learning Python | |
Rizvi | Development of algorithms and computational grammar for Urdu | |
Hamoud | A Question Answering System Design about the Holy Quran | |
Jolly et al. | A Detailed Analysis of Core NLP for Information Extraction | |
Hoque et al. | An effective approach for relevant paragraph retrieval in Question Answering systems | |
Taye et al. | An Ontology Learning Framework for unstructured Arabic Text | |
NEIMA | AMHARIC WORD SENSE DISAMBIGUATION USING TRANSFER LEARNING |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080129 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080201 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080228 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080328 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090127 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090424 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090430 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090721 |