CN110574102A - 信息处理系统、信息处理装置、计算机程序以及词典数据库的更新方法 - Google Patents

信息处理系统、信息处理装置、计算机程序以及词典数据库的更新方法 Download PDF

Info

Publication number
CN110574102A
CN110574102A CN201880028451.2A CN201880028451A CN110574102A CN 110574102 A CN110574102 A CN 110574102A CN 201880028451 A CN201880028451 A CN 201880028451A CN 110574102 A CN110574102 A CN 110574102A
Authority
CN
China
Prior art keywords
keyword
dictionary database
database
processing apparatus
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880028451.2A
Other languages
English (en)
Other versions
CN110574102B (zh
Inventor
前田赖宣
石桥善成
板谷昌治
本乡大辅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Manufacturing Co Ltd
Original Assignee
Murata Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Manufacturing Co Ltd filed Critical Murata Manufacturing Co Ltd
Publication of CN110574102A publication Critical patent/CN110574102A/zh
Application granted granted Critical
Publication of CN110574102B publication Critical patent/CN110574102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

信息处理装置将从声音处理装置收集的声音提取的关键词存放到关键词数据库,该关键词与注册在声音处理装置的词典数据库的关键词一致。信息处理装置若从声音处理装置接收到更新声音处理装置的词典数据库的指示,则推测存放在关键词数据库的关键词的关联词,基于存放在关键词数据库的关键词和推测的关联词制作更新后的词典数据库,并将更新后的词典数据库发送到声音处理装置。

Description

信息处理系统、信息处理装置、计算机程序以及词典数据库的 更新方法
技术领域
本发明涉及信息处理系统、信息处理装置、计算机程序以及词典数据库的更新方法。
背景技术
伴随着社交网络服务(SNS)、评论网站的普及,参考关于特定的设施、店铺的他人的消息、评价的顾客正在增加。例如,顾客会考虑访问在SNS中投稿了正面的消息的设施、利用在评论网站中附有高的评价的店铺。在这样的SNS、评论网站中,有时会进行被称为“隐形营销”的行为。所谓“隐形营销”,是如下的行为,即,假扮成一般消费者投稿评论、报导,面向一般消费者进行宣传,使得觉察不到是商品广告,从而人为地使商品或服务流行。因此,仅分析SNS、评论网站等互联网上的评价,难以判断在互联网上受到高评价的商品或服务是仅在互联网上流行,还是在现实世界中也实际流行。另一方面,像在引用文献1、2记载的那样,已知有将声音信息文本化并将其作为文字信息而进行识别的声音识别技术。
在先技术文献
专利文献
专利文献1:国际公开WO2008/072413A1号公报
专利文献2:日本特开2016-90891号公报
发明内容
发明要解决的课题
但是,欲使用在专利文献1、2记载的声音识别技术从顾客的声音提取关键词并根据关键词来判断商品或服务是否实际流行,需要对注册关键词的词典数据库进行优化,使得适当地进行该判断。
因此,本发明的课题在于,对词典数据库进行优化,使得能够适当地判断商品或服务是否实际流行。
用于解决课题的技术方案
为了解决上述的课题,本发明相关的信息处理系统具备声音处理装置和信息处理装置。声音处理装置具备:声音收集单元,收集声音;词典数据库,注册关键词;提取单元,从由声音收集单元收集的声音提取注册在词典数据库的关键词;指示单元,制作词典数据库的更新指示;以及第一通信单元,将由提取单元提取的关键词和由指示单元制作的更新指示发送到信息处理装置。信息处理装置具备:第二通信单元,接收从第一通信单元发送的关键词以及更新指示;关键词数据库,存放通过第二通信单元接收的关键词;推测单元,响应于通过第二通信单元接收的更新指示,推测存放在关键词数据库的关键词的关联词;以及词典数据库制作单元,基于存放在关键词数据库的关键词和推测的关联词,制作更新后的词典数据库。第二通信单元将更新后的词典数据库发送到声音处理装置。
发明效果
根据本发明相关的信息处理系统,能够对词典数据库进行优化,使得能够适当地判断商品或服务是否实际流行。
附图说明
图1是本实施方式相关的信息处理系统的结构图。
图2是示出本实施方式相关的关键词提取处理的流程的流程图。
图3是示出本实施方式相关的词典数据库更新处理的流程的流程图。
具体实施方式
以下,参照各图对本发明的实施方式进行说明。在此,设同一附图标记表示同一构成要素,并省略重复的说明。
图1是本发明的实施方式相关的信息处理系统10的结构图。信息处理系统10是用于通过声音识别来判断商品或服务是否实际流行的计算机系统。信息处理系统10具备声音处理装置20和信息处理装置30。声音处理装置20以及信息处理装置30连接为能够通过通信网络40进行通信。
声音处理装置20是用于进行收集顾客的声音并从收集的声音提取关键词的处理的计算机。“关键词”是成为用于通过声音识别来判断商品或服务是否实际流行的指标的单词。在从顾客的声音提取的关键词例如为“方向盘”、“刹车”、“轮胎”等的情况下,能够推测为正在进行与“汽车”相关的话题。声音处理装置20可以是设置在顾客所利用的设施、店铺的计算机,或者也可以是利用设施、店铺的顾客持有的计算机(例如,被称为智能电话的多功能便携式电话机、平板终端等)。
声音处理装置20作为其硬件资源而具备处理器21、存储资源22、通信接口23、以及传声器24。传声器24可以是声音处理装置20的内置传声器,或者也可以是外设传声器(外设型的有线式传声器或无线式的传声器)。例如,连接了外设传声器的平板终端作为声音处理装置20而发挥功能。
处理器21是具备处理算数运算、逻辑运算、比特运算等的算数逻辑运算单元以及各种寄存器(数据寄存器、命令寄存器、通用寄存器等)的CPU(Central Processing Unit,中央处理单元)。处理器21通过解释以及执行存放在存储资源22的计算机程序220,从而对声音处理装置20的动作(例如,声音收集处理、关键词提取处理、通信处理等)进行控制。
存储资源22是物理器件的存储区域提供的逻辑器件,作为存储单元而发挥功能。作为物理器件,例如能够使用硬盘驱动器、固态驱动器、存储卡、光盘驱动器、半导体存储器等计算机可读的记录介质。半导体存储器可以是易失性存储器,或者也可以是非易失性存储器。在存储资源22存储有计算机程序220和词典数据库230。在词典数据库230注册有关键词。
通信接口23经由通信网络40对声音处理装置20与信息处理装置30之间的通信进行控制。通信网络40例如是混合存在有线网络(例如,近距离通信网、广域通信网、或附加价值通信网等)和无线网络(移动通信网、卫星通信网、蓝牙、WiFi(Wireless Fidelity,无线保真)、HSDPA(High Speed Downlink Packet Access,高速下行分组接入)等)的通信网。也可以使对声音处理装置20与信息处理装置30之间的通信协议进行变换的网关网站介于两者之间。
传声器24例如是具备带抛物面的集声板的集声传声器,作为收集声音的声音收集单元而发挥功能。传声器24对利用设施、店铺的顾客的声音进行集声,将集声的声音进行A/D变换,并临时保存在存储资源22的一部分的存储区域(缓冲存储器)。
计算机程序220是用于控制声音处理装置20的动作的程序,具备从主程序之中调用并执行的多个软件模块。这样的软件模块分别是为了执行特定的处理(例如,关键词提取处理、词典数据库更新指示制作处理、通信处理等)而被模块化的子程序。软件模块例如使用过程、子例程、方法、函数、或数据结构等制作。作为被模块化的子程序,计算机程序220具备关键词提取模块221、词典数据库更新指示制作模块222、以及通信模块223。
关键词提取模块221是记述了从由传声器24收集的声音提取与注册在词典数据库230的关键词一致的关键词的处理的子程序。关键词提取模块221将由传声器24收集的声音的信息文本化并将其作为字符串信息而进行识别,通过比较字符串信息和关键词,从而从声音提取关键词。在将声音的信息文本化的处理中,从由传声器24收集的声音的信息检测发声区间,对检测出的发声区间进行基于统计语言模型的模式匹配。统计语言模型例如是用于计算单词的出现分布、继某个单词之后出现的单词的分布等语言表达的出现概率的概率模型。通过声音处理装置20的硬件资源和关键词提取模块221的协作,可实现从由传声器24收集的声音提取注册在词典数据库230的关键词的作为提取单元的功能。
词典数据库更新指示制作模块222是记述了制作用于更新词典数据库230的指示(词典数据库更新指示)的处理的子程序。词典数据库更新指示以给定的契机进行制作。在此,给定的契机可以是词典数据库230的命中率低于预先确定的阈值的时间点,或者也可以是预先确定的恒定间隔。所谓命中率,意味着注册在词典数据库230的全部的关键词之中曾经被判定为包含于顾客的声音的关键词的比例。通过声音处理装置20的硬件资源和词典数据库更新指示制作模块222的协作,可实现制作词典数据库更新指示的作为指示单元的功能。
通信模块223是记述了服从声音处理装置20与信息处理装置30之间的通信协议的通信处理的子程序。通过声音处理装置20的硬件资源和通信模块223的协作,可实现作为通信单元的功能。由关键词提取模块221提取的关键词通过通信接口23发送到信息处理装置30。同样地,由词典数据库更新指示制作模块222制作的词典数据库更新指示通过通信接口23发送到信息处理装置30。
信息处理装置30是如下的计算机,即,通过接收从声音处理装置20发送的关键词并对其进行累积,从而根据累积的关键词来推测话题。推测的话题例如提供给广告商。此外,为了优化词典数据库230,信息处理装置30还进行更新词典数据库230的处理。
信息处理装置30作为其硬件资源而具备处理器31、存储资源32、以及通信接口33。处理器31、存储资源32、以及通信接口33的硬件结构与处理器21、存储资源22、以及通信接口23的硬件结构相同,因此省略其详细的说明。
通信接口33接收从声音处理装置20发送的关键词以及词典数据库更新指示。在存储资源32存储有计算机程序320和关键词数据库330。关键词数据库330存放通过通信接口33接收的关键词。
计算机程序320是用于控制信息处理装置30的动作的程序,具备在主程序之中调用并执行的多个软件模块。这样的软件模块分别是为了执行特定的处理(例如,关联词推测处理、词典数据库更新处理、通信处理等)而被模块化的子程序。作为这样的软件模块,计算机程序320具备推测模块321、词典数据库制作模块322、以及通信模块323。
推测模块321是响应于通过通信接口33接收的词典数据库更新指示而推测存放在关键词数据库330的关键词的关联词的子程序。所谓关键词的关联词,意味着与关键词频繁地同时使用的语句,这样的语句也被称为“共现词”。共现词未必一定意味着同义词。推测模块321例如是应用了人工智能的共现词检索工具。作为这样的共现词检索工具,例如已知有如下的共现词检索工具,即,用成为谷歌、雅虎等的检索结果的上位的网页的内容进行形态素解析,将在同一文件中频繁出现的语句作为共现词进行提示。所谓形态素解析,意味着如下的作业,即,基于对象语言的语法、称为词典的单词的词类等信息,从没有语法性的信息的注释的自然语言的文本数据分解为形态素(在语言上具有意义的最小单位)的串,并判别各个形态素的词类等。通过信息处理装置30的硬件资源和推测模块321的协作,可实现推测关键词的关联词的作为推测单元的功能。
词典数据库制作模块322是响应于通过通信接口33接收的词典数据库更新指示而对词典数据库230进行更新的子程序。词典数据库制作模块322基于存放在关键词数据库330的关键词和由推测模块321推测的关联词,制作更新后的词典数据库230。更新后的词典数据库230将曾经从顾客的声音提取过的关键词及其关联词注册为关键词。将注册在更新前的词典数据库230的关键词中的未从顾客的声音提取过的关键词从更新后的词典数据库230删除。通过重复这样的更新处理,从而能够提高词典数据库230的命中率。通过信息处理装置30的硬件资源和词典数据库制作模块322的协作,可实现制作更新后的词典数据库230的作为词典数据库制作单元的功能。
通信模块323是记述了服从信息处理装置30与声音处理装置20之间的通信协议的通信处理的子程序。通过信息处理装置30的硬件资源和通信模块323的协作,可实现作为通信单元的功能。通信接口33将更新后的词典数据库230发送到声音处理装置20。接收到更新后的词典数据库230的声音处理装置20将更新前的词典数据库230替换为更新后的词典数据库230。
另外,在本说明书中,对声音处理装置20的通信单元和信息处理装置30的通信单元进行区分的情况下,将前者称为第一通信单元,将后者称为第二通信单元。
为了便于说明,在图1中示出了单个声音处理装置20连接于单个信息处理装置30的例子,但是也可以是多个声音处理装置20连接于多个信息处理装置30。此外,也可以是多个声音处理装置20连接于单个信息处理装置30,或者还可以是单个声音处理装置20连接于多个信息处理装置30。
接着,参照图2对关键词提取处理的流程进行说明。
声音处理装置20通过传声器24收集顾客的声音(步骤201)。传声器24可以在声音处理装置20运转的期间持续收集声音,或者也可以间歇性地(以恒定时间间隔)收集声音。接着,声音处理装置20参照词典数据库230(步骤202),从声音提取关键词(步骤203)。声音处理装置20可以在声音处理装置20运转的期间从声音持续提取关键词。接着,声音处理装置20将提取的关键词发送到信息处理装置30(步骤204)。声音处理装置20可以在声音处理装置20运转的期间将关键词持续发送到信息处理装置30,或者也可以间歇性地(以恒定时间间隔)将关键词发送到信息处理装置30。另外,在未从由传声器24收集的声音提取关键词的情况下,不进行向信息处理装置30的关键词的发送。另一方面,信息处理装置30接收从声音处理装置20发送的关键词(步骤205),将接收的关键词注册在关键词数据库330(步骤206)。
接着,参照图3对词典数据库更新处理的流程进行说明。
声音处理装置20以给定的契机制作词典数据库更新指示(步骤301),并将其发送到信息处理装置30(步骤302)。信息处理装置30若接收到词典数据库更新指示(步骤303),则从关键词数据库330获取关键词(步骤304),并推测关键词的关联词(步骤305)。接着,信息处理装置30基于关键词及其关联词制作更新后的词典数据库230(步骤306),并将其发送到声音处理装置20(步骤307)。声音处理装置20若接收到更新后的词典数据库230(步骤308),则通过将更新前的词典数据库230替换为更新后的词典数据库230,从而更新词典数据库230(步骤309)。
像以上说明的那样,通过基于从声音处理装置20收集的声音提取的关键词及其关联词对词典数据库230进行更新,从而能够提高词典数据库230的命中率,该关键词与注册在声音处理装置20的词典数据库230的关键词一致。由此,能够优化词典数据库230,使得能够适当地判断商品或服务是否实际流行。此外,传声器24收集的声音是顾客实际发声的声音,因此不是以互联网上的评价为基础,而是能够以现实社会中的评价为基础来判断商品或服务是否实际流行。此外,通过重复词典数据库230的更新,从而从词典数据库230删除无用的关键词,因此词典数据库230的存储容量可以少。由此,声音处理装置20的小型化以及低功耗化成为可能。
另外,以上说明的各实施方式用于使本发明容易理解,并非用于对本发明进行限定解释。本发明能够在不脱离其主旨的情况下进行变更/改良,并且本发明还包含其等价物。即,本领域技术人员对各实施方式适当地施加了设计变更的实施方式,只要具备本发明的特征,也包含于本发明的范围。此外,只要技术上可行,各实施方式具备的各要素就能够进行组合,将它们进行了组合的实施方式只要包含本发明的特征,就包含于本发明的范围。
附图标记说明
10:信息处理系统,20:声音处理装置,21:处理器,22:存储资源,23:通信接口,24:传声器,30:信息处理装置,31:处理器,32:存储资源,33:通信接口,40:通信网络,220:计算机程序,221:关键词提取模块,222:词典数据库更新指示制作模块,223:通信模块,230:词典数据库,320:计算机程序,321:推测模块,322:词典数据库制作模块,323:通信模块,330:关键词数据库。

Claims (4)

1.一种信息处理系统,具备声音处理装置和信息处理装置,其中,
所述声音处理装置具备:
声音收集单元,收集声音;
词典数据库,注册关键词;
提取单元,从由所述声音收集单元收集的所述声音提取注册在所述词典数据库的所述关键词;
指示单元,制作所述词典数据库的更新指示;以及
第一通信单元,将由所述提取单元提取的所述关键词和由所述指示单元制作的所述更新指示发送到所述信息处理装置,
所述信息处理装置具备:
第二通信单元,接收从所述第一通信单元发送的所述关键词以及所述更新指示;
关键词数据库,存放通过所述第二通信单元接收的所述关键词;
推测单元,响应于通过所述第二通信单元接收的所述更新指示,推测存放在所述关键词数据库的关键词的关联词;以及
词典数据库制作单元,基于存放在所述关键词数据库的关键词和推测的所述关联词,制作更新后的词典数据库,
所述第二通信单元将所述更新后的词典数据库发送到所述声音处理装置。
2.一种信息处理装置,具备:
通信单元,从声音处理装置接收从所述声音处理装置收集的声音提取的关键词和所述词典数据库的更新指示,所述关键词与注册在所述声音处理装置的词典数据库的关键词一致;
关键词数据库,存放通过所述通信单元接收的所述关键词;
推测单元,响应于通过所述通信单元接收的所述更新指示,推测存放在所述关键词数据库的关键词的关联词;以及
词典数据库制作单元,基于存放在所述关键词数据库的关键词和推测的所述关联词,制作更新后的词典数据库,
所述通信单元将所述更新后的词典数据库发送到所述声音处理装置。
3.一种计算机程序,使计算机执行:
从声音处理装置接收从所述声音处理装置收集的声音提取的关键词和所述词典数据库的更新指示的步骤,所述关键词与注册在所述声音处理装置的词典数据库的关键词一致;
将接收的所述关键词存放到关键词数据库的步骤;
响应于接收的所述更新指示,推测存放在所述关键词数据库的关键词的关联词的步骤;
基于存放在所述关键词数据库的关键词和推测的所述关联词,制作更新后的词典数据库的步骤;以及
将所述更新后的词典数据库发送到所述声音处理装置的步骤。
4.一种词典数据库的更新方法,由计算机执行:
从声音处理装置接收从所述声音处理装置收集的声音提取的关键词和所述词典数据库的更新指示的步骤,所述关键词与注册在所述声音处理装置的词典数据库的关键词一致;
将接收的所述关键词存放到关键词数据库的步骤;
响应于接收的所述更新指示,推测存放在所述关键词数据库的关键词的关联词的步骤;
基于存放在所述关键词数据库的关键词和推测的所述关联词,制作更新后的词典数据库的步骤;以及
将所述更新后的词典数据库发送到所述声音处理装置的步骤。
CN201880028451.2A 2017-05-11 2018-03-27 信息处理系统、信息处理装置、记录介质以及词典数据库的更新方法 Active CN110574102B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017-094907 2017-05-11
JP2017094907 2017-05-11
PCT/JP2018/012432 WO2018207485A1 (ja) 2017-05-11 2018-03-27 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法

Publications (2)

Publication Number Publication Date
CN110574102A true CN110574102A (zh) 2019-12-13
CN110574102B CN110574102B (zh) 2023-05-16

Family

ID=64105194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880028451.2A Active CN110574102B (zh) 2017-05-11 2018-03-27 信息处理系统、信息处理装置、记录介质以及词典数据库的更新方法

Country Status (4)

Country Link
US (1) US11289071B2 (zh)
JP (1) JP6611091B2 (zh)
CN (1) CN110574102B (zh)
WO (1) WO2018207485A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002493A1 (ko) * 2019-07-01 2021-01-07 엘지전자 주식회사 지능형 게이트웨이 장치 및 그를 포함하는 제어 시스템

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271596A (ja) * 2002-03-15 2003-09-26 Fuji Xerox Co Ltd 言語処理装置
CN1991975A (zh) * 2005-12-26 2007-07-04 佳能株式会社 语音信息处理设备和语音信息处理方法
CN101231660A (zh) * 2008-02-19 2008-07-30 林超 电话自然对话中关键信息的挖掘系统及其方法
CN101309327A (zh) * 2007-04-16 2008-11-19 索尼株式会社 语音聊天系统、信息处理装置、话语识别和关键字检测
JP2009169470A (ja) * 2008-01-10 2009-07-30 Nissan Motor Co Ltd 情報案内システムおよびその認識辞書データベース更新方法
JP2009205640A (ja) * 2008-02-29 2009-09-10 Nec Corp 情報収集管理システム、方法、及び、プログラム
CN101558443A (zh) * 2006-12-15 2009-10-14 三菱电机株式会社 声音识别装置
US20090292528A1 (en) * 2008-05-21 2009-11-26 Denso Corporation Apparatus for providing information for vehicle
CN101889281A (zh) * 2008-03-10 2010-11-17 松下电器产业株式会社 内容检索装置及内容检索方法
CN102915729A (zh) * 2011-08-01 2013-02-06 佳能株式会社 语音关键词检出系统、创建用于其的词典的系统和方法
US20140088967A1 (en) * 2012-09-24 2014-03-27 Kabushiki Kaisha Toshiba Apparatus and method for speech recognition
JP2016090891A (ja) * 2014-11-07 2016-05-23 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194460B2 (en) * 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
KR100679051B1 (ko) * 2005-12-14 2007-02-05 삼성전자주식회사 복수의 신뢰도 측정 알고리즘을 이용한 음성 인식 장치 및방법
JP2008242836A (ja) * 2007-03-27 2008-10-09 Toshiba Corp 辞書更新装置およびプログラム
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US8352557B2 (en) * 2008-08-11 2013-01-08 Centurylink Intellectual Property Llc Message filtering system
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
KR101643179B1 (ko) * 2010-11-11 2016-07-27 네이버 주식회사 추천 키워드를 제공하는 시스템 및 방법
US8818944B2 (en) * 2011-06-30 2014-08-26 Microsoft Corporation Data change tracking and event notification
US20130086033A1 (en) * 2011-10-03 2013-04-04 Black Hills Ip Holdings, Llc Systems, methods and user interfaces in a patent management system
JP6205771B2 (ja) * 2013-03-18 2017-10-04 富士通株式会社 議論支援プログラム、議論支援方法及び議論支援サーバ
US9760831B2 (en) * 2013-08-30 2017-09-12 LimeSpot Solutions Inc. Content personalization system
JP5596213B1 (ja) * 2013-09-05 2014-09-24 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
JP5627750B1 (ja) * 2013-09-11 2014-11-19 株式会社Ubic 文書分析システム及び文書分析方法並びに文書分析プログラム
WO2015118616A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic 文書分析システム、文書分析方法、および、文書分析プログラム
US9959863B2 (en) * 2014-09-08 2018-05-01 Qualcomm Incorporated Keyword detection using speaker-independent keyword models for user-designated keywords
US10102273B2 (en) * 2014-12-30 2018-10-16 Facebook, Inc. Suggested queries for locating posts on online social networks
EP3151131A1 (en) * 2015-09-30 2017-04-05 Hitachi, Ltd. Apparatus and method for executing an automated analysis of data, in particular social media data, for product failure detection
US20170147652A1 (en) * 2015-11-19 2017-05-25 Institute For Information Industry Search servers, end devices, and search methods for use in a distributed network
CN109643314A (zh) * 2016-08-29 2019-04-16 索尼公司 信息处理装置、信息处理方法和程序
CN108027820A (zh) * 2016-09-02 2018-05-11 百度时代网络技术(北京)有限公司 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统
JP2018049230A (ja) * 2016-09-23 2018-03-29 シャープ株式会社 辞書作成装置、辞書作成プログラム、音声認識装置、音声認識プログラムおよび記録媒体
JP6781961B2 (ja) * 2016-09-29 2020-11-11 株式会社村田製作所 送信装置、送信方法及び送信プログラム
EP3526699A1 (en) * 2016-10-11 2019-08-21 Koninklijke Philips N.V. Patient-centric clinical knowledge discovery system
US20180365324A1 (en) * 2017-04-24 2018-12-20 Considdr Inc. Method of data organization and data searching for use in constructing evidence-based beliefs

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271596A (ja) * 2002-03-15 2003-09-26 Fuji Xerox Co Ltd 言語処理装置
CN1991975A (zh) * 2005-12-26 2007-07-04 佳能株式会社 语音信息处理设备和语音信息处理方法
CN101558443A (zh) * 2006-12-15 2009-10-14 三菱电机株式会社 声音识别装置
CN101309327A (zh) * 2007-04-16 2008-11-19 索尼株式会社 语音聊天系统、信息处理装置、话语识别和关键字检测
JP2008287697A (ja) * 2007-04-16 2008-11-27 Sony Corp 音声チャットシステム、情報処理装置およびプログラム
JP2009169470A (ja) * 2008-01-10 2009-07-30 Nissan Motor Co Ltd 情報案内システムおよびその認識辞書データベース更新方法
CN101231660A (zh) * 2008-02-19 2008-07-30 林超 电话自然对话中关键信息的挖掘系统及其方法
JP2009205640A (ja) * 2008-02-29 2009-09-10 Nec Corp 情報収集管理システム、方法、及び、プログラム
CN101889281A (zh) * 2008-03-10 2010-11-17 松下电器产业株式会社 内容检索装置及内容检索方法
US20090292528A1 (en) * 2008-05-21 2009-11-26 Denso Corporation Apparatus for providing information for vehicle
CN102915729A (zh) * 2011-08-01 2013-02-06 佳能株式会社 语音关键词检出系统、创建用于其的词典的系统和方法
US20140088967A1 (en) * 2012-09-24 2014-03-27 Kabushiki Kaisha Toshiba Apparatus and method for speech recognition
JP2016090891A (ja) * 2014-11-07 2016-05-23 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム

Also Published As

Publication number Publication date
WO2018207485A1 (ja) 2018-11-15
US20200058292A1 (en) 2020-02-20
US11289071B2 (en) 2022-03-29
CN110574102B (zh) 2023-05-16
JPWO2018207485A1 (ja) 2020-02-27
JP6611091B2 (ja) 2019-11-27

Similar Documents

Publication Publication Date Title
CN108885623B (zh) 基于知识图谱的语意分析系统及方法
US20180342241A1 (en) Method and Apparatus of Recognizing Field of Semantic Parsing Information, Device and Readable Medium
WO2020108063A1 (zh) 特征词的确定方法、装置和服务器
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
JP2020521210A (ja) 情報処理方法及び端末、コンピュータ記憶媒体
US8949243B1 (en) Systems and methods for determining a rating for an item from user reviews
CN103324745A (zh) 基于贝叶斯模型的文本垃圾识别方法和系统
CN103729474A (zh) 用于识别论坛用户马甲账号的方法和系统
US10217455B2 (en) Linguistic model database for linguistic recognition, linguistic recognition device and linguistic recognition method, and linguistic recognition system
CN110222139B (zh) 道路实体数据去重方法、装置、计算设备和介质
CN113436614B (zh) 语音识别方法、装置、设备、系统及存储介质
JP6563350B2 (ja) データ分類装置、データ分類方法、及びプログラム
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN110574102A (zh) 信息处理系统、信息处理装置、计算机程序以及词典数据库的更新方法
JP7096199B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
US20170293597A1 (en) Methods and systems for data processing
CN111209391A (zh) 信息识别模型的建立方法及系统、拦截方法及系统
JP2016162163A (ja) 情報処理装置及び情報処理プログラム
JP6154072B2 (ja) 情報分析システム、情報分析方法及び情報分析プログラム
JP6373197B2 (ja) 多数のコメントから地図経路関連コメントを抽出するコメント分類プログラム、サーバ及び方法
JP6282174B2 (ja) テキストを用いたルート案内方法
CN113076932A (zh) 训练音频语种识别模型的方法、视频检测方法及其装置
CN112818972A (zh) 兴趣点图像的检测方法、装置、电子设备及存储介质
KR20120058417A (ko) 문서 유사도 산출의 맞춤화 및 최적화에 기초한 기계 학습 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant