CN113779978A - 一种无监督跨语言句对齐实现方法 - Google Patents

一种无监督跨语言句对齐实现方法 Download PDF

Info

Publication number
CN113779978A
CN113779978A CN202111130753.0A CN202111130753A CN113779978A CN 113779978 A CN113779978 A CN 113779978A CN 202111130753 A CN202111130753 A CN 202111130753A CN 113779978 A CN113779978 A CN 113779978A
Authority
CN
China
Prior art keywords
sentence
vector
similarity
translated
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111130753.0A
Other languages
English (en)
Inventor
陈件
潘丽婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yizhe Information Technology Co ltd
Original Assignee
Shanghai Yizhe Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yizhe Information Technology Co ltd filed Critical Shanghai Yizhe Information Technology Co ltd
Priority to CN202111130753.0A priority Critical patent/CN113779978A/zh
Publication of CN113779978A publication Critical patent/CN113779978A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Abstract

本发明公开了一种无监督跨语言句对齐实现方法,包括如下步骤:S100、无监督生成句向量;S110、将不同语言文本进行分词,使得原文、译文中的句子被分割为多个独立的词;S120、根据分词结果,获取句子的向量;S200、相似度计算;S300、句匹配。本发明的句对齐是基于无监督生成句向量,根据句子的语义相似度、句长相似度和位置相似度等,进行句子匹配,该方法支持104种语言之间的句子对齐。本发明不再利用规则和机器翻译,相对来说,成本更低,准确率更高。本发明支持多语言,之前针对于不同的语言都要调用机器翻译(调用机器翻译需要额外费用或者投入),现在利用多语言蒸馏后的模型,成本大大降低,根据我们的测试数据,准确率提高25%。

Description

一种无监督跨语言句对齐实现方法
技术领域
本发明涉及翻译技术,特别是涉及一种无监督跨语言句对齐实现方法。
背景技术
一般的双语句子对齐方法依赖于机器翻译模型,通过机器翻译模型将原文和译文映射到同一种语言(源语言或者目标语言),计算文本相似度,最后进行匹配。这种对齐方法的数据成本和训练成本较高,不同语言的双语对齐都需要对应的机器翻译模型。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种无监督跨语言句对齐实现方法,其成本低且支持多种语言。
为实现上述目的,本发明提供了一种无监督跨语言句对齐实现方法,包括如下步骤:
S100、无监督生成句向量
S110、将不同语言文本进行分词,使得原文、译文中的句子被分割为多个独立的词;
S120、根据分词结果,获取句子的向量;
S200、相似度计算
相似度是语义相似度、位置相似度和句长相似度的乘积(公式3),语义相似度为原文句向量和译文句向量的余弦距离(公式4),位置相似度为原文的句子位置和译文的句子位置的相对距离(公式5),句长相似度是原文句长占比和译文句子占比的差距(公式6):
SIMij=SEMij*POSij*LENij (3)
Figure BDA0003280402380000021
Figure BDA0003280402380000022
Figure BDA0003280402380000023
其中,SIMij表示原文第i个句向量和译文第j个句向量的相似度,SEMij表示原文第i个句向量和译文第j个句向量的语义相似度;
POSij表示原文第i个句向量和译文第j个句向量的位置相似度,vi表示原文第i个句向量,vj表示译文第j个句向量,cs表示原文的句数,ct表示译文的句数;α为超参数,限制位置相似度的权重,α的经验取值为0.5。
LENij表示原文第i个句子的长度占比和译文第j个句子的长度占比的句长相似度,ls是原文所有句子的长度,lt是译文所有句子的长度,lsi是原文第i个句子的长度,ltj是译文第j个句子的长度;
S300、句匹配
S310、原文句向量和译文句向量使用双向最优匹配,即当原文第i个句向量的相似度最高是译文第j个句向量,同时译文第j个句向量的相似度最高是原文第i个句向量时,第i个原文句向量与第j个译文句向量匹配(公式7):
Figure BDA0003280402380000024
Figure BDA0003280402380000031
作为本发明的改进技术方案,S110中,使用wordpiece算法对不同语言文本进行分词。
作为本发明的改进技术方案,S120还包括:根据分词结果,加载distil-mBERT预训练模型,使用multi-head和self-attention输出6层隐藏向量,由于低层隐藏向量包含语法信息,高层隐藏向量包含语义信息,因此选取低层次隐藏向量和高层次隐藏向量的均值作为词向量(公式1);所有词向量相加,再除以词数得到词向量均值,作为句子的向量(公式2):
Figure BDA0003280402380000032
Figure BDA0003280402380000033
其中vw是词向量,vs是句子的向量,hlow是低层次隐藏向量,hhigh是高层次隐藏向量,c是词数、w是句子第w个单词或者字。
作为本发明的改进技术方案,S300中还包括:
S320、双向最优匹配无法一次性将所有的原文句子和译文句子,为了匹配剩下的句向量,需要不断更新相似度矩阵SIMij(公式10),不断进行双向匹配;
根据已匹配的句对集合M*(公式8),构建遮罩矩阵MASKij(公式9),遮罩矩阵将未匹配句子的匹配范围从全局约束到局部,不断双向最优匹配,得到新的匹配句对,缩小原文和译文的匹配范围;
根据遮罩矩阵,更新局部位置相似度矩阵(公式10),把语义相似度矩阵与局部位置相似度矩阵相乘,更新相似度矩阵,进行下一次双向最优匹配;不断重复公式7-11的操作,直到所有原文和译文句子匹配:
Figure BDA0003280402380000034
Figure BDA0003280402380000041
LOCAL_POSij=POSij*MASKij (10)
SIM′ij=LOCAL_POSij*SEMij (11)
其中,Mij为句对匹配矩阵,1为匹配,0为不匹配;M*为已匹配句对集合;MASKij为遮罩矩阵,1为不遮罩,0为遮罩。
本发明的有益效果是:
1、本发明的句对齐是基于distilbert-base-multilingual-cased(distil-mBERT)的词向量,无监督生成句向量,根据句子的语义相似度、句长相似度和位置相似度等,进行句子匹配,该方法支持104种语言之间的句子对齐。
2、本发明不再利用规则和机器翻译,相对来说,成本更低,准确率更高。
3、本发明支持多语言,之前针对于不同的语言都要调用机器翻译(调用机器翻译需要额外费用或者投入),现在利用多语言蒸馏后的模型,成本大大降低,准确率也有显著提高。
附图说明
图1是最优匹配运行流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
一种无监督跨语言句对齐实现方法,包括如下步骤:
S100、无监督生成句向量
S110、使用wordpiece算法对不同语言文本进行分词,比如原文:“我爱中国”和译文:“I love China”,分词后分别得到“我”,“爱”,“中”,“国”和“I”,“love”,“China“。
S120、根据分词结果,加载distil-mBERT预训练模型,使用multi-head和self-attention输出6层隐藏向量,由于低层隐藏向量包含语法信息,高层隐藏向量包含语义信息,因此选取低层次隐藏向量和高层次隐藏向量的均值作为词向量(公式1);所有词向量相加,再除以词数得到词向量均值,作为句子的向量(公式2):
Figure BDA0003280402380000051
Figure BDA0003280402380000052
其中vw是词向量,vs是句子的向量,hlow是低层次隐藏向量,hhigh是高层次隐藏向量,c是词数、w是句子第w个单词或者字。
S200、相似度计算
相似度是语义相似度、位置相似度和句长相似度的乘积(公式3),语义相似度为原文句向量和译文句向量的余弦距离(公式4),位置相似度为原文的句子位置和译文的句子位置的相对距离(公式5),句长相似度是原文句长占比和译文句子占比的差距(公式6):
SIMij=SEMij*POSij*LENij (3)
Figure BDA0003280402380000053
Figure BDA0003280402380000061
Figure BDA0003280402380000062
其中,SIMij表示原文第i个句向量和译文第j个句向量的相似度,SEMij表示原文第i个句向量和译文第j个句向量的语义相似度。POSij表示原文第i个句向量和译文第j个句向量的位置相似度,vi表示原文第i个句向量,vj表示译文第j个句向量,cs表示原文的句数,ct表示译文的句数;α为超参数,限制位置相似度的权重,α的经验取值为0.5。LENij表示原文第i个句子的长度占比和译文第j个句子的长度占比的句长相似度,ls是原文所有句子的长度,lt是译文所有句子的长度,lsi是原文第i个句子的长度,ltj是译文第j个句子的长度。
S300、句匹配
S310、原文句向量和译文句向量使用双向最优匹配,即当原文第i个句向量的相似度最高是译文第j个句向量,同时译文第j个句向量的相似度最高是原文第i个句向量时,第i个原文句向量与第j个译文句向量匹配(公式7):
Figure BDA0003280402380000063
S320、双向最优匹配无法一次性将所有的原文句子和译文句子,为了匹配剩下的句向量,需要不断更新相似度矩阵SIMij(公式10),不断进行双向匹配;
根据已匹配的句对集合M*(公式8),构建遮罩矩阵MASKij(公式9),遮罩矩阵的目的是为了将未匹配句子的匹配范围从全局约束到局部,比如20句原文和25句译文,第一*次匹配后得到原文第4句和译文第7句匹配,那么生成遮罩矩阵将原文和译文切分为2段,使得原文第1-4句只和译文第1-7句匹配,原文第4-20句只和译文第7-25句匹配,不断双向最优匹配,得到新的匹配句对,可以缩小原文和译文的匹配范围;
根据遮罩矩阵,更新局部位置相似度矩阵(公式10),把语义相似度矩阵与局部位置相似度矩阵相乘,更新相似度矩阵,进行下一次双向最优匹配(如图1)。不断重复公式7-11的操作,直到所有原文和译文句子匹配:
Figure BDA0003280402380000071
Figure BDA0003280402380000072
LOCAL_POSij=POSij*MASKij (10)
SIM′ij=LOCAL_POSij*SEMij (11)
其中,Mij为句对匹配矩阵,1为匹配,0为不匹配。M*为已匹配句对集合。MASKij为遮罩矩阵,1为不遮罩,0为遮罩。
本发明未详述之处,均为本领域技术人员的公知技术。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (6)

1.一种无监督跨语言句对齐实现方法,其特征在于,包括如下步骤:
S100、无监督生成句向量;
S200、相似度计算
相似度是语义相似度、位置相似度和句长相似度的乘积(公式3),语义相似度为原文句向量和译文句向量的余弦距离(公式4),位置相似度为原文的句子位置和译文的句子位置的相对距离(公式5),句长相似度是原文句长占比和译文句子占比的差距(公式6):
SIMij=SEMij*POSij*LENij (3)
Figure FDA0003280402370000011
Figure FDA0003280402370000012
Figure FDA0003280402370000013
其中,SIMij表示原文第i个句向量和译文第j个句向量的相似度,SEMij表示原文第i个句向量和译文第j个句向量的语义相似度;
POSij表示原文第i个句向量和译文第j个句向量的位置相似度,vi表示原文第i个句向量,vj表示译文第j个句向量,cs表示原文的句数,ct表示译文的句数;α为超参数,限制位置相似度的权重;
LENij表示原文第i个句子的长度占比和译文第j个句子的长度占比的句长相似度,ls是原文所有句子的长度,lt是译文所有句子的长度,lsi是原文第i个句子的长度,ltj是译文第j个句子的长度;
S300、句匹配
S310、原文句向量和译文句向量使用双向最优匹配,即当原文第i个句向量的相似度最高是译文第j个句向量,同时译文第j个句向量的相似度最高是原文第i个句向量时,第i个原文句向量与第j个译文句向量匹配(公式7):
Figure FDA0003280402370000021
2.如权利要求1所述的无监督跨语言句对齐实现方法,其特征在于,S100还包括:
S110、将不同语言文本进行分词,使得原文、译文中的句子被分割为多个独立的词;
S120、根据分词结果,获取句子的向量。
3.如权利要求2所述的无监督跨语言句对齐实现方法,其特征在于,S110中,使用wordpiece算法对不同语言文本进行分词。
4.如权利要求2所述的无监督跨语言句对齐实现方法,其特征在于,S120还包括:
根据分词结果,加载distil-mBERT预训练模型,使用multi-head和self-attention输出6层隐藏向量,由于低层隐藏向量包含语法信息,高层隐藏向量包含语义信息,因此选取低层次隐藏向量和高层次隐藏向量的均值作为词向量(公式1);所有词向量相加,再除以词数得到词向量均值,作为句子的向量(公式2):
Figure FDA0003280402370000022
Figure FDA0003280402370000031
其中vw是词向量,vs是句子的向量,hlow是低层次隐藏向量,hhigh是高层次隐藏向量,c是词数、w是句子第w个单词或者字。
5.如权利要求1所述的无监督跨语言句对齐实现方法,其特征在于,α取值为0.5。
6.如权利要求1所述的无监督跨语言句对齐实现方法,其特征在于,S300中还包括:
S320、双向最优匹配无法一次性将所有的原文句子和译文句子,为了匹配剩下的句向量,需要不断更新相似度矩阵SIMij(公式10),不断进行双向匹配;
根据已匹配的句对集合M*(公式8),构建遮罩矩阵MASKij(公式9),遮罩矩阵将未匹配句子的匹配范围从全局约束到局部,不断双向最优匹配,得到新的匹配句对,缩小原文和译文的匹配范围;
根据遮罩矩阵,更新局部位置相似度矩阵(公式10),把语义相似度矩阵与局部位置相似度矩阵相乘,更新相似度矩阵,进行下一次双向最优匹配;不断重复公式7-11的操作,直到所有原文和译文句子匹配:
Figure FDA0003280402370000032
Figure FDA0003280402370000033
LOCAL_POSij=POSij*MASKij (10)
SIM′ij=LOCAL_POSij*SEMij (11)
其中,Mij为句对匹配矩阵,1为匹配,0为不匹配;M*为已匹配句对集合;MASKij为遮罩矩阵,1为不遮罩,0为遮罩。
CN202111130753.0A 2021-09-26 2021-09-26 一种无监督跨语言句对齐实现方法 Pending CN113779978A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111130753.0A CN113779978A (zh) 2021-09-26 2021-09-26 一种无监督跨语言句对齐实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111130753.0A CN113779978A (zh) 2021-09-26 2021-09-26 一种无监督跨语言句对齐实现方法

Publications (1)

Publication Number Publication Date
CN113779978A true CN113779978A (zh) 2021-12-10

Family

ID=78853531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111130753.0A Pending CN113779978A (zh) 2021-09-26 2021-09-26 一种无监督跨语言句对齐实现方法

Country Status (1)

Country Link
CN (1) CN113779978A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417879A (zh) * 2021-12-29 2022-04-29 北京百度网讯科技有限公司 跨语言文本语义模型的生成方法、装置及电子设备
CN115618885A (zh) * 2022-09-22 2023-01-17 无锡捷通数智科技有限公司 一种语句的翻译方法、装置、电子设备和存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050143971A1 (en) * 2003-10-27 2005-06-30 Jill Burstein Method and system for determining text coherence
US20130330008A1 (en) * 2011-09-24 2013-12-12 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
US20140316768A1 (en) * 2012-12-14 2014-10-23 Pramod Khandekar Systems and methods for natural language processing
CN105868187A (zh) * 2016-03-25 2016-08-17 北京语言大学 多译本平行语料库的构建方法
CN106484682A (zh) * 2015-08-25 2017-03-08 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN109062910A (zh) * 2018-07-26 2018-12-21 苏州大学 基于深度神经网络的句子对齐方法
CN109213995A (zh) * 2018-08-02 2019-01-15 哈尔滨工程大学 一种基于双语词嵌入的跨语言文本相似度评估技术
CN111444700A (zh) * 2020-04-02 2020-07-24 山东山大鸥玛软件股份有限公司 一种基于语义文档表达的文本相似度量方法
CN112633008A (zh) * 2020-12-28 2021-04-09 中国石油大学(华东) 基于多特征注意力的卷积神经网络句子相似度计算方法
CN112668307A (zh) * 2020-12-30 2021-04-16 清华大学 一种双语句子自动对齐方法及装置
CN112766002A (zh) * 2021-01-14 2021-05-07 语联网(武汉)信息技术有限公司 基于动态规划的文本对齐方法及系统
CN113065358A (zh) * 2021-04-07 2021-07-02 齐鲁工业大学 面向银行咨询服务基于多粒度对齐的文本对语义匹配方法
CN113254593A (zh) * 2021-06-18 2021-08-13 平安科技(深圳)有限公司 文本摘要生成方法、装置、计算机设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050143971A1 (en) * 2003-10-27 2005-06-30 Jill Burstein Method and system for determining text coherence
US20130330008A1 (en) * 2011-09-24 2013-12-12 Lotfi A. Zadeh Methods and Systems for Applications for Z-numbers
US20140316768A1 (en) * 2012-12-14 2014-10-23 Pramod Khandekar Systems and methods for natural language processing
CN106484682A (zh) * 2015-08-25 2017-03-08 阿里巴巴集团控股有限公司 基于统计的机器翻译方法、装置及电子设备
CN105868187A (zh) * 2016-03-25 2016-08-17 北京语言大学 多译本平行语料库的构建方法
CN109062910A (zh) * 2018-07-26 2018-12-21 苏州大学 基于深度神经网络的句子对齐方法
CN109213995A (zh) * 2018-08-02 2019-01-15 哈尔滨工程大学 一种基于双语词嵌入的跨语言文本相似度评估技术
CN111444700A (zh) * 2020-04-02 2020-07-24 山东山大鸥玛软件股份有限公司 一种基于语义文档表达的文本相似度量方法
CN112633008A (zh) * 2020-12-28 2021-04-09 中国石油大学(华东) 基于多特征注意力的卷积神经网络句子相似度计算方法
CN112668307A (zh) * 2020-12-30 2021-04-16 清华大学 一种双语句子自动对齐方法及装置
CN112766002A (zh) * 2021-01-14 2021-05-07 语联网(武汉)信息技术有限公司 基于动态规划的文本对齐方法及系统
CN113065358A (zh) * 2021-04-07 2021-07-02 齐鲁工业大学 面向银行咨询服务基于多粒度对齐的文本对语义匹配方法
CN113254593A (zh) * 2021-06-18 2021-08-13 平安科技(深圳)有限公司 文本摘要生成方法、装置、计算机设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
V. SOWMYA等: "Influence of Token Similarity Measures for Semantic Textual Similarity", 2016 IEEE 6TH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTING, 18 August 2016 (2016-08-18), pages 41 *
倪耀群;许洪波;程学旗;: "基于多特征融合和图匹配的维汉句子对齐", 中文信息学报, vol. 30, no. 04, 15 July 2016 (2016-07-15), pages 124 *
张国成等: "多策略汉英平行语料的过滤方法研究", 厦门大学学报, vol. 60, no. 4, 21 June 2021 (2021-06-21), pages 641 *
曹小鹏等: "多头自注意力机制Siamese网络文本相似度计算方法", 微电子学与计算机, vol. 38, no. 10, 14 September 2021 (2021-09-14), pages 15 *
陈泽龙: "基于句法表征的专利文本相似性评估", 中国优秀硕士学位论文全文数据库信息科技辑, no. 1, 15 January 2020 (2020-01-15), pages 138 - 2416 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417879A (zh) * 2021-12-29 2022-04-29 北京百度网讯科技有限公司 跨语言文本语义模型的生成方法、装置及电子设备
CN114417879B (zh) * 2021-12-29 2022-12-27 北京百度网讯科技有限公司 跨语言文本语义模型的生成方法、装置及电子设备
CN115618885A (zh) * 2022-09-22 2023-01-17 无锡捷通数智科技有限公司 一种语句的翻译方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN107273355B (zh) 一种基于字词联合训练的中文词向量生成方法
Baniata et al. A Neural Machine Translation Model for Arabic Dialects That Utilizes Multitask Learning (MTL).
de Sousa Neto et al. HTR-Flor: A deep learning system for offline handwritten text recognition
CN106021227B (zh) 一种基于状态转移与神经网络的汉语组块分析方法
Ban et al. Design of English automatic translation system based on machine intelligent translation and secure internet of things
CN113343683B (zh) 一种融合自编码器和对抗训练的中文新词发现方法及装置
CN113779978A (zh) 一种无监督跨语言句对齐实现方法
CN110555084A (zh) 基于pcnn和多层注意力的远程监督关系分类方法
CN114676255A (zh) 文本处理方法、装置、设备、存储介质及计算机程序产品
Ren et al. Detecting the scope of negation and speculation in biomedical texts by using recursive neural network
CN115422939B (zh) 一种基于大数据的细粒度商品命名实体识别方法
Kišš et al. AT-ST: self-training adaptation strategy for OCR in domains with limited transcriptions
Guo et al. Local government debt risk assessment: A deep learning-based perspective
CN114254645A (zh) 一种人工智能辅助写作系统
CN113065350A (zh) 一种基于注意力神经网络的生物医学文本词义消岐方法
Sun Analysis of Chinese machine translation training based on deep learning technology
CN116702760A (zh) 一种基于预训练深度学习的地理命名实体纠错方法
CN116680407A (zh) 一种知识图谱的构建方法及装置
CN116595189A (zh) 基于两阶段的零样本关系三元组抽取方法及系统
CN114357975A (zh) 一种多语言的术语识别和双语术语对齐方法
Seilsepour et al. Self-supervised sentiment classification based on semantic similarity measures and contextual embedding using metaheuristic optimizer
Xu Research on neural network machine translation model based on entity tagging improvement
CN109960782A (zh) 一种基于深度神经网络的藏文分词方法及装置
CN115510230A (zh) 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法
CN115688779A (zh) 一种基于自监督深度学习的地址识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination