CN103186522A - 电子设备及其自然语言分析方法 - Google Patents

电子设备及其自然语言分析方法 Download PDF

Info

Publication number
CN103186522A
CN103186522A CN2011104499481A CN201110449948A CN103186522A CN 103186522 A CN103186522 A CN 103186522A CN 2011104499481 A CN2011104499481 A CN 2011104499481A CN 201110449948 A CN201110449948 A CN 201110449948A CN 103186522 A CN103186522 A CN 103186522A
Authority
CN
China
Prior art keywords
result
segmenting words
sortord
analysis result
probable value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104499481A
Other languages
English (en)
Other versions
CN103186522B (zh
Inventor
熊雨凯
陆欣
翁世芳
刘慧丰
吕东生
张玉勇
朱健健
成响林
周小山
黄选峰
姜安林
李新华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuzhan Precision Technology Co ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Shenzhen Yuzhan Precision Technology Co ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuzhan Precision Technology Co ltd, Hon Hai Precision Industry Co Ltd filed Critical Shenzhen Yuzhan Precision Technology Co ltd
Priority to CN201110449948.1A priority Critical patent/CN103186522B/zh
Priority to TW101100938A priority patent/TWI512503B/zh
Priority to US13/710,480 priority patent/US20130173251A1/en
Publication of CN103186522A publication Critical patent/CN103186522A/zh
Application granted granted Critical
Publication of CN103186522B publication Critical patent/CN103186522B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

一种自然语言分析方法,用于包括语料库的电子设备。该方法包括如下步骤:接收用户语音和/或文字输入并转换为电信号;将用户的信号转换为文本信息;将文本信息切分为包括多个词汇的多种词汇切分结果;从语料库中获取多种词汇切分结果中每一词汇的使用频率,计算每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照第一概率值排序,得到对语言分析结果的第一排序方式;根据句式构造规则将文本信息进行语句成分划分;计算出各种词汇切分结果的第二概率值,并得到语言分析结果的第二排序方式;及确定用于回应用户的文本信息的一回复信息。本发明还提供了一种应用上述方法的电子设备。本发明提高了电子设备理解用户的自然语言的准确度。

Description

电子设备及其自然语言分析方法
技术领域
本发明涉及一种电子设备及其自然语言分析方法。
背景技术
随着技术的发展,具有人机会话功能的计算机等智能型的电子设备越来越受到消费者的亲睐。然而,自然语言理解一直是人工智能学科内引人注目而又困难重重的一个核心研究课题。在人机会话的过程中,电子设备将用户的自然语言通过词汇切分法等方式进行切分,并通过分析排除不适当的歧义,从而形成对应原文的机器可识别的语言。然后结合预存的语料库来理解用户的自然语言,通过转换最终得到句子的语意。然而,在自然语言理解处理过程中,语言的复杂性导致理解处理结果会产生多种语言歧义,尤其是中文语言,往往存在电子设备错误理解用户的语言的问题。
发明内容
有鉴于此,有必要提供一种用于电子设备的自然语言分析方法,可提高电子设备理解用户的自然语言的准确度,以便于更有效的人机会话,以解决上述问题。
有鉴于此,还有必要提供一种采用自然语言分析方法的电子设备,以解决上述问题。
一种自然语言分析方法,用于包括存储有语料库的电子设备。所述语料库记录了多个词汇以及每一词汇的使用频率。所述方法包括如下步骤:
接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;
将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;
将所述文本信息切分为包括多个词汇的多种词汇切分结果;
从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式;
在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;
根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及
根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
一种电子设备,包括存储有语料库的存储单元和输入单元。所述语料库记录了多个词汇以及每一词汇的使用频率。所述输入单元用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号。所述电子设备还包括:
一语言文字转换模块,用于将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;
一词汇切分模块,用于将所述文本信息切分为包括多个词汇的多种词汇切分结果;
一语句分析模块,用于在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;
一分析控制模块,用于从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到对语言分析结果的第一排序方式;以及根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及
一智能会话模块,用于根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
相对于现有技术,上述电子设备及其自然语言分析方法,当用户启动电子设备后,用户可以通过输入单元与电子设备进行人机会话,通过将用户的语音和/或文字输入转换为一文本信息,并将该文本信息切分为多个词汇的多种词汇词汇切分结果,并将与多种词汇切分结果对应的语言分析结果进行排序得到语言分析结果的第一排序方式,再将该文本信息进行语句划分,并根据语句划分结果对语言分析结果的第一排序方式进行调整,得到第二排序方式,最后将该文本信息进行段落分析,并根据段落分析结果对语言分析结果的第二排序方式进行调整,得到第三排序方式,从而更准确的理解用户的自然语言,提高了人机会话的效率。
附图说明
图1为本发明一实施方式的电子设备的功能模块图。
图2为本发明中电子设备的自然语言分析方法的步骤流程图。
主要元件符号说明
电子设备 100
存储单元 10
语料库 12
输入单元 20
处理单元 30
语音文字转换模块 31
词汇切分模块 32
语句分析模块 33
分析控制模块 34
段落分析模块 35
智能会话模块 36
缓存器 40
显示单元 50
语音输出单元 60
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
请参阅图1,其为本发明的一实施方式的电子设备100的功能模块图。电子设备100可更准确的理解用户自然语言,具有较高的人机会话效率。在本实施方式中,电子设备100为一电脑,在其他实施方式中,电子设备100还可以是手机等电子设备。
电子设备100包括一存储单元10、一输入单元20、一处理单元30、一显示单元50和一语音输出单元60。
存储单元10存储有语料库12。语料库12记录了海量的词汇以及每一词汇的使用频率。语料库12是按照明确的语言学标准选择并排序的语言运用材料汇集,是按照明确的设计标准集成的可机读的大型文本库。在本实施方式中,语料库12是存有大量的中文自然语言的文本库,在其他实施方式中,该语料库12还可以存储有英文、日文等其他语言种类的自然语言的文本库。具体文本的语言种类可以根据需要设置。
输入单元20用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号,并将转换得到的语音信号和/或文字输入信号传输至处理单元30。
处理单元30包括一语音文字转换模块31、一词汇切分模块32、一语句分析模块33和一分析控制模块34。
当用户开启电子设备100后,输入单元20即被启动,用户可以通过输入单元20与电子设备100进行人机会话。
语音文字转换模块31用于将输入单元20传输的用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息。在本实施方式中,该预设的语言为中文,该文本信息可以为包括一个词、一句话或一段话的文本信息。在其他实施方式中,该预设的语言还可以是英文、日文等。
词汇切分模块32用于将语音文字转换模块31转换得到的文本信息切分为包括多个词汇的多种词汇切分结果,并将所述多种词汇切分结果一一传输至分析控制模块34。在本实施方式中,词汇切分模块32按照双向最大匹配法对文本信息进行切分以提高词汇切分的准确度,即从正向和逆向均进行切分,并将多种词汇切分结果均传输至分析控制模块34。例如:当文本信息为包括“老虎咬死了猎人的狗”这句话时,词汇切分模块32从正向将该文本信息可以切分为包括“老虎”、“咬”、“死了”、“猎人”、“的”和“狗”这些词汇的一个词汇切分结果,包括“老虎”、“咬死了”、“猎人”、“的”和“狗”这些词汇的另一个词汇切分结果,以及包括“老虎”、“咬死了”和“猎人的狗”这些词汇的又一个词汇切分结果等;词汇切分模块32从反向将该文本信息可以切分为包括“狗”、“的”、“猎人”、“死了”、“咬”和“老虎”这些词汇的一个词汇切分结果,包括“狗”、“的”、“猎人”、“咬死了”和“老虎”这些词汇的另一个词汇切分结果,以及包括“猎人的狗”、“咬死了”和“老虎”这些词汇的又一个词汇切分结果等。
分析控制模块34用于从存储在存储单元10的语料库12中获取词汇切分模块32传输的切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到对语言分析结果的第一排序方式。在本实施方式中,每一种词汇切分结果对应一种语言分析结果,词汇切分结果的概率值越高,则根据该词汇切分结果所对应的语言分析结果对自然语言的理解为最接近用户的意思的理解,或是与用户的意思相同的理解。分析控制模块34将各种词汇切分结果按照第一概率值的降序排序,第一概率值最大的词汇切分结果排在最前面,即语言分析结果中最可能的分析结果排在最前面。
语句分析模块33用于在多种词汇切分结果的基础上根据句式构造规则,将语音文字转换模块31转换得到的文本信息进行语句成分划分,并将语句划分结果传输至分析控制模块34。
分析控制模块34还用于根据语句分析模块33传输的语句划分结果,计算出词汇切分模块32所切分得到的各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式。在一实施方式中,分析控制模块34还用于根据每一种词汇切分结果的第二概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第二排序方式中删除该词汇切分结果所对应的语言分析结果。其中,词汇切分结果的第二概率值越低,则根据该词汇切分结果所对应的语言分析结果得到的理解越会偏离用户的本意。
处理单元30还包括一段落分析模块35,用于根据上下文理解法对用户的一预设时段内的文本信息进行分析,并将段落分析结果传输至分析控制模块34。
分析控制模块34还用于根据段落分析模块35传输的段落分析结果,计算出词汇切分模块32所切分得到的各种词汇切分结果的第三概率值,并根据各种词汇切分结果的第三概率值对所述语言分析结果的第二排序方式进行调整,得到语言分析结果的第三排序方式。在一实施方式中,分析控制模块34还用于根据每一种词汇切分结果的第三概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第三排序方式中删除该词汇切分结果所对应的语言分析结果。
处理单元30还包括一智能会话模块36,智能会话模块36用于根据所述第二排序方式中排在最前面的语言分析结果以及语料库12确定用于回应用户的所述文本信息的一回复信息。在一实施方式中,智能会话模块36根据语言分析结果的第三排序方式以及语料库12确定一回复信息。
语音文字转换模块31还用于将智能会话模块36所确定的回复信息转换为自然语言的文本信息和/或语音信号;并控制将所述文本信息显示于显示单元50和/或将所述语音信号通过语音输出单元60进行播放。
电子设备100还包括一缓存器40,用于暂存语音文字转换模块31转换得到的文本信息、词汇切分模块32所切分的各个词汇以及词汇切分结果、语句分析模块33所划分的语句成分划分结果、段落分析模块35所分析得到的分析结果以及分析控制模块34计算得到的概率值及语言分析结果的各种排序方式,即第一排序方式、第二排序方式及第三排序方式。
请参阅图2,其为本发明的电子设备100的自然语言分析方法的流程图,用于存储有语料库12的电子设备,语料库12记录了海量的词汇以及每一词汇的使用频率。该自然语言分析方法包括:
步骤S20,输入单元20接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号。
步骤S21,语音文字转换模块31将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息。在本实施方式中,该预设的语言为中文,该文本信息可以为包括一个词、一句话或一段话的文本信息。在其他实施方式中,该预设的语言还可以是英文、日文等。
步骤S22,词汇切分模块32将转换得到的所述文本信息切分为包括多个词汇的多种词汇切分结果。
步骤S23,分析控制模块34从语料库12中获取所述词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式。在本实施方式中,每一种词汇切分结果对应一种语言分析结果,分析控制模块34将各种词汇切分结果按照概率值的降序排序,概率值最大的词汇切分结果排在最前面,即语言分析结果中最可能的分析结果排在最前面。
步骤S24,语句分析模块33在多种词汇切分结果的基础上根据句式构造规则将所述文本信息进行语句成分划分。
步骤S25,分析控制模块34根据语句分析模块33传输的语句划分结果,计算出词汇切分模块32所切分得到的各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式。在一实施方式中,分析控制模块34还根据每一种词汇切分结果的第二概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第二排序方式中删除该词汇切分结果所对应的语言分析结果。其中,词汇切分结果的第二概率值越低,则根据该词汇切分结果所对应的语言分析结果得到的理解越会偏离用户的本意。
步骤S26,段落分析模块35根据上下文理解法对用户的一预设时段内的文本信息进行分析,并将段落分析结果传输至分析控制模块34。
步骤S27,分析控制模块34根据所述段落分析结果,计算出词汇切分模块32所切分得到的各种词汇切分结果的第三概率值,并根据各种词汇切分结果的第三概率值对所述语言分析结果的第二排序方式进行调整,得到语言分析结果的第三排序方式。在一实施方式中,分析控制模块34还根据每一种词汇切分结果的第三概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第三排序方式中删除该词汇切分结果所对应的语言分析结果。
步骤S28,智能会话模块36根据所述第三排序方式中排在最前面的语言分析结果以及语料库12确定用于回应用户的所述文本信息的一回复信息。在一实施方式中,智能会话模块36根据语言分析结果的第二排序方式以及语料库12确定一回复信息。
步骤S29,语音文字转换模块31将所述回复信息转换为自然语言的文本信息和/或语音信号;并控制将所述文本信息显示于显示单元50和/或将所述语音信号通过语音输出单元进行播放。
使用上述电子设备100及其自然语言分析方法,当用户启动电子设备100后,用户可以通过输入单元20与电子设备100进行人机会话,通过将用户的语音和/或文字输入转换为一文本信息,并将该文本信息切分为多个词汇的多种词汇切分结果,并将与多种词汇切分结果对应的语言分析结果进行排序得到语言分析结果的第一排序方式,再将该文本信息进行语句划分,并根据语句划分结果对语言分析结果的第一排序方式进行调整,得到第二排序方式,最后将该文本信息进行段落分析,并根据段落分析结果对语言分析结果的第二排序方式进行调整,得到第三排序方式,从而更准确的理解用户的自然语言,提高了人机会话的效率。
本技术领域的普通技术人员应当认识到,以上的实施方式仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围之内,对以上实施方式所作的适当改变和变化都落在本发明要求保护的范围之内。

Claims (10)

1.一种自然语言分析方法,用于包括存储有语料库的电子设备,所述语料库记录了多个词汇以及每一词汇的使用频率,所述方法包括如下步骤:
接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;
将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;
将所述文本信息切分为包括多个词汇的多种词汇切分结果;
从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式;
在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;
根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及
根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
2.如权利要求1所述的方法,其特征在于,还包括:
根据上下文理解法对用户的一预设时段内的文本信息进行分析;及
根据所述段落分析结果,计算出各种词汇切分结果的第三概率值,并根据各种词汇切分结果的第三概率值对所述语言分析结果的第二排序方式进行调整,得到语言分析结果的第三排序方式,其中,所述第三排序方式是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序。
3.如权利要求2所述的方法,其特征在于,还包括:根据所述第三排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
4.如权利要求3所述的方法,其特征在于,还包括:
根据每一种词汇切分结果的概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第二排序方式和/或第三排序方式中删除该词汇切分结果所对应的语言分析结果。
5.如权利要求3所述的方法,其特征在于,还包括:
将所述回复信息转换为自然语言的文本信息和/或语音信号;及
显示所述文本信息和/或播放所述语音信号。
6.一种电子设备,包括存储有语料库的存储单元和输入单元,所述语料库记录了多个词汇以及每一词汇的使用频率,所述输入单元用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号,其特征在于,所述电子设备还包括:
一语音文字转换模块,用于将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;
一词汇切分模块,用于将所述文本信息切分为包括多个词汇的多种词汇切分结果;
一语句分析模块,用于在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;
一分析控制模块,用于从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到对语言分析结果的第一排序方式;以及根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及
一智能会话模块,用于根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
7.如权利要求6所述的电子设备,其特征在于,还包括一段落分析模块,用于根据上下文理解法对用户的一预设时段内的文本信息进行分析;所述分析控制模块还用于根据所述段落分析结果,计算出各种词汇切分结果的第三概率值,并根据各种词汇切分结果的第三概率值对所述语言分析结果的第二排序方式进行调整,得到语言分析结果的第三排序方式,其中,所述第三排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序。
8.如权利要求7所述的电子设备,其特征在于,还包括:根据所述第三排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。
9.如权利要求8所述的电子设备,其特征在于:所述分析控制模块还用于根据每一种词汇切分结果的概率值将概率值低的词汇切分结果排除,同时在语言分析结果的第二排序方式和/或第三排序方式中删除该词汇切分结果所对应的语言分析结果。
10.如权利要求8所述的电子设备,其特征在于,还包括:
一语音文字转换模块,用于将所述回复信息转换为自然语言的文本信息和/或语音信号;及
显示所述文本信息的显示单元和/或播放所述语音信号的语音输出单元。
CN201110449948.1A 2011-12-29 2011-12-29 电子设备及其自然语言分析方法 Expired - Fee Related CN103186522B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201110449948.1A CN103186522B (zh) 2011-12-29 2011-12-29 电子设备及其自然语言分析方法
TW101100938A TWI512503B (zh) 2011-12-29 2012-01-10 電子設備及其自然語言分析方法
US13/710,480 US20130173251A1 (en) 2011-12-29 2012-12-11 Electronic device and natural language analysis method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110449948.1A CN103186522B (zh) 2011-12-29 2011-12-29 电子设备及其自然语言分析方法

Publications (2)

Publication Number Publication Date
CN103186522A true CN103186522A (zh) 2013-07-03
CN103186522B CN103186522B (zh) 2018-01-26

Family

ID=48677693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110449948.1A Expired - Fee Related CN103186522B (zh) 2011-12-29 2011-12-29 电子设备及其自然语言分析方法

Country Status (3)

Country Link
US (1) US20130173251A1 (zh)
CN (1) CN103186522B (zh)
TW (1) TWI512503B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209781A (zh) * 2015-01-21 2017-09-26 微软技术许可有限责任公司 使用自然语言的上下文搜索
CN110008317A (zh) * 2019-01-23 2019-07-12 艾肯特公司 自然智能的自然表达处理方法、回应方法、设备及系统
CN113041623A (zh) * 2019-12-26 2021-06-29 波克科技股份有限公司 游戏参数配置方法及装置、计算机可读存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484729B (zh) * 2015-08-31 2020-05-08 华为技术有限公司 一种词汇生成、分类方法及装置
CN106126546A (zh) * 2016-06-15 2016-11-16 北京智能管家科技有限公司 级联裂变查询方法及装置
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
TWI665567B (zh) 2018-09-26 2019-07-11 華碩電腦股份有限公司 語意處理方法、電子裝置以及非暫態電腦可讀取記錄媒體
CN112509570B (zh) * 2019-08-29 2024-02-13 北京猎户星空科技有限公司 语音信号处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131691A (zh) * 2006-08-25 2008-02-27 韩国电子通信研究院 翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法
US20080097742A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Computer product for phrase alignment and translation, phrase alignment device, and phrase alignment method
CN101563683A (zh) * 2006-12-18 2009-10-21 诺基亚公司 提供基于灵活文本的语言识别的方法、设备和计算机程序产品
US20100076746A1 (en) * 2008-09-25 2010-03-25 Microsoft Corporation Computerized statistical machine translation with phrasal decoder
CN101802812A (zh) * 2007-08-01 2010-08-11 金格软件有限公司 使用互联网语料库的自动的上下文相关的语言校正和增强

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606597B1 (en) * 2000-09-08 2003-08-12 Microsoft Corporation Augmented-word language model
US7421418B2 (en) * 2003-02-19 2008-09-02 Nahava Inc. Method and apparatus for fundamental operations on token sequences: computing similarity, extracting term values, and searching efficiently
WO2005115559A2 (en) * 2004-05-17 2005-12-08 Aurilab, Llc. Interactive language learning system and method
JP4652737B2 (ja) * 2004-07-14 2011-03-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、
US7774197B1 (en) * 2006-09-27 2010-08-10 Raytheon Bbn Technologies Corp. Modular approach to building large language models
US7809719B2 (en) * 2007-02-08 2010-10-05 Microsoft Corporation Predicting textual candidates
US8224087B2 (en) * 2007-07-16 2012-07-17 Michael Bronstein Method and apparatus for video digest generation
US8725666B2 (en) * 2010-02-26 2014-05-13 Lawrence Livermore National Security, Llc. Information extraction system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131691A (zh) * 2006-08-25 2008-02-27 韩国电子通信研究院 翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法
US20080097742A1 (en) * 2006-10-19 2008-04-24 Fujitsu Limited Computer product for phrase alignment and translation, phrase alignment device, and phrase alignment method
CN101563683A (zh) * 2006-12-18 2009-10-21 诺基亚公司 提供基于灵活文本的语言识别的方法、设备和计算机程序产品
CN101802812A (zh) * 2007-08-01 2010-08-11 金格软件有限公司 使用互联网语料库的自动的上下文相关的语言校正和增强
US20100076746A1 (en) * 2008-09-25 2010-03-25 Microsoft Corporation Computerized statistical machine translation with phrasal decoder

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冀铁亮,穗志方: "词汇化句法分析与子语类框架获取的互动方法", 《中文信息学报》 *
胡长春: "基于Lucene的中文自然语言搜索引擎", 《中国优秀硕士学文论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209781A (zh) * 2015-01-21 2017-09-26 微软技术许可有限责任公司 使用自然语言的上下文搜索
CN110008317A (zh) * 2019-01-23 2019-07-12 艾肯特公司 自然智能的自然表达处理方法、回应方法、设备及系统
CN113041623A (zh) * 2019-12-26 2021-06-29 波克科技股份有限公司 游戏参数配置方法及装置、计算机可读存储介质
CN113041623B (zh) * 2019-12-26 2023-04-07 波克科技股份有限公司 游戏参数配置方法及装置、计算机可读存储介质

Also Published As

Publication number Publication date
TWI512503B (zh) 2015-12-11
CN103186522B (zh) 2018-01-26
TW201327218A (zh) 2013-07-01
US20130173251A1 (en) 2013-07-04

Similar Documents

Publication Publication Date Title
CN107204184B (zh) 语音识别方法及系统
CN103186522A (zh) 电子设备及其自然语言分析方法
CN106446045B (zh) 基于对话交互的用户画像的构建方法及系统
CN102760436B (zh) 一种语音词库筛选方法
CN103186523A (zh) 电子设备及其自然语言分析方法
CN110020422A (zh) 特征词的确定方法、装置和服务器
CN104731959A (zh) 基于文本的网页内容生成视频摘要的方法、装置及系统
CN103268313A (zh) 一种自然语言的语义解析方法及装置
CN104199972A (zh) 一种基于深度学习的命名实体关系抽取与构建方法
CN106570180A (zh) 基于人工智能的语音搜索方法及装置
US8356065B2 (en) Similar text search method, similar text search system, and similar text search program
CN103187052A (zh) 一种建立用于语音识别的语言模型的方法及装置
CN105096942A (zh) 语义分析方法和装置
CN110808032A (zh) 一种语音识别方法、装置、计算机设备及存储介质
CN105096934A (zh) 构建语音特征库的方法、语音合成方法、装置及设备
CN103514230A (zh) 一种用于根据语料序列训练语言模型的方法与设备
EP2950306A1 (en) A method and system for building a language model
CN114579104A (zh) 数据分析场景的生成方法、装置、设备及存储介质
CN102375863A (zh) 一种地理信息领域的关键字提取的方法及装置
CN103903618A (zh) 一种语音输入方法及电子设备
CN113139043A (zh) 问答样本生成方法、装置、电子设备和存储介质
CN106550268B (zh) 视频处理方法和视频处理装置
CN114141235A (zh) 语音语料库生成方法、装置、计算机设备和存储介质
CN106844357B (zh) 大句库翻译方法
CN112417875A (zh) 配置信息的更新方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180126

Termination date: 20211229

CF01 Termination of patent right due to non-payment of annual fee