CN108292317A - 问题和答案处理方法以及支持该方法的电子设备 - Google Patents
问题和答案处理方法以及支持该方法的电子设备 Download PDFInfo
- Publication number
- CN108292317A CN108292317A CN201680068844.7A CN201680068844A CN108292317A CN 108292317 A CN108292317 A CN 108292317A CN 201680068844 A CN201680068844 A CN 201680068844A CN 108292317 A CN108292317 A CN 108292317A
- Authority
- CN
- China
- Prior art keywords
- answer
- information
- electronic equipment
- processor
- additional information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000003672 processing method Methods 0.000 title claims description 31
- 230000006854 communication Effects 0.000 claims abstract description 87
- 238000004891 communication Methods 0.000 claims abstract description 86
- 230000004044 response Effects 0.000 claims abstract description 45
- 238000003860 storage Methods 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000003384 imaging method Methods 0.000 claims description 14
- 230000002093 peripheral effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 44
- 238000012545 processing Methods 0.000 description 28
- 238000004458 analytical method Methods 0.000 description 25
- 230000033001 locomotion Effects 0.000 description 25
- 238000007726 management method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 235000013305 food Nutrition 0.000 description 9
- 230000005611 electricity Effects 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 206010068052 Mosaicism Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000001747 pupil Anatomy 0.000 description 4
- 210000003765 sex chromosome Anatomy 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000010411 cooking Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000002414 leg Anatomy 0.000 description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000002583 angiography Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000002567 electromyography Methods 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- XEGGRYVFLWGFHI-UHFFFAOYSA-N bendiocarb Chemical compound CNC(=O)OC1=CC=CC2=C1OC(C)(C)O2 XEGGRYVFLWGFHI-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009530 blood pressure measurement Methods 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- DMBHHRLKUKUOEG-UHFFFAOYSA-N diphenylamine Chemical compound C=1C=CC=CC=1NC1=CC=CC=C1 DMBHHRLKUKUOEG-UHFFFAOYSA-N 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003760 hair shine Effects 0.000 description 1
- 230000037219 healthy weight Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000001646 magnetic resonance method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010358 mechanical oscillation Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 230000007659 motor function Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 229910052724 xenon Inorganic materials 0.000 description 1
- FHNFHKCVQCLJFQ-UHFFFAOYSA-N xenon atom Chemical compound [Xe] FHNFHKCVQCLJFQ-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L2013/083—Special characters, e.g. punctuation marks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
Abstract
提供了一种电子设备。该电子设备包括通信接口和被配置为与通信接口功能地连接的处理器,该通信接口包括通信电路,其中该处理器被配置为:获得语音信号,与获得语音信号相关地获得与用户相关联的语境信息,如果语境信息满足第一条件,则确定与语音信号相对应的第一响应信息;如果语境信息满足第二条件,则确定与语音信号相对应的第二响应信息;并且将与第一响应信息和/或第二响应信息相对应的响应信息的至少一部分发送到与电子设备可操作地连接的输出设备或电子设备的外部电子设备。
Description
技术领域
本公开一般涉及电子设备中的问题和答案(question and answer,QA)处理方法及其装置。
背景技术
电子设备可以包括支持处理用户问题项目的答案的QA系统。QA系统可以从用户接收诸如语音或文本的命令,并且可以经由识别引擎分析所接收的用户命令。QA系统可以提取适合于用户命令的关键字并且可以提取与提取的关键字相对应的创建的内容。
发明内容
技术问题
由于QA系统简单地输出对从用户输入的命令(诸如语音或文本)的简短答案,其可能输出与用户的意图不相符的答案。例如,由于QA系统仅仅简单地输出对于用户命令的指定的答案,因此用户可能获得少量信息,或者用户要获得的信息的准确性可能低。因此,提供有效和准确的信息是困难的。另外,由于QA系统只输出指定的答案,因此可能提供不对应用户条件的答案。
技术方案
根据本公开的示例方面,提供了一种电子设备。该电子设备可以包括通信接口和被配置为与通信电路功能性连接的处理器,该通信接口包括所述通信电路,其中处理器被配置为:获得用户的语音信号,与获得语音信号相关地获得(或验证)与用户关联的语境信息;如果所述语境信息满足第一条件,则确定与语音信号相对应的第一响应信息;如果所述语境信息满足第二条件,则确定与语音信号相对应的第二响应信息;并且将与所述第一响应信息或所述第二响应信息相对应的响应信息的至少一部分发送到与所述电子设备可操作地连接的输出设备或所述电子设备的外部电子设备。
根据本公开的另一示例方面,提供了一种电子设备。该电子设备可以包括音频设备,其包括被配置为获得语音信号的音频电路;存储器,被配置为存储与所述语音信号相关联的问题和/或答案;以及可操作地与音频设备和/或存储器连接的处理器,其中所述处理器被配置为:将获得的语音信号转换为文本;基于存储在存储器中的数据搜索与转换的文本相对应的问题或与问题相对应的答案;获得找到的问题或答案的属性信息;基于答案和属性信息生成附加信息;以及输出答案或附加信息中的至少一个。
根据本公开的另一示例方面,提供了一种问题和答案(QA)处理方法。该问题和答案(QA)处理方法可以包括:在电子设备中获得语音信号;将获得的语音信号转换成文本;基于存储在与所述电子设备可操作地连接的存储器中的数据,搜索与所述转换的文本相对应的问题或与所述问题相对应的答案;获得找到的问题或答案的属性信息;基于答案和属性信息生成附加信息;以及输出答案或附加信息中的至少一个。
根据以下结合附图公开了本公开的各种示例实施例的详细描述,本公开的其他方面和显著特征对于本领域技术人员将变得显而易见。
有益效果
本公开的各方面至少解决上述问题和/或缺点,并且提供至少下面描述的优点。因此,本公开的示例方面为要提供一种QA处理方法和用于支持该方法的电子设备,该QA处理方法基于各种输出方法允许用户更容易地识别和理解答案。
因此,本公开的另一示例方面是要提供一种QA处理方法和用于支持该方法的电子设备,该QA处理方法用于通过提供答案和/或附加信息中的至少一个来提高用户要获得的信息的准确性。
因此,本公开的另一示例方面是提供一种QA处理方法和用于支持该方法的电子设备,该QA处理方法用于通过基于用户条件经由各种电子设备提供答案来方便地提供用于验证答案的环境。
附图说明
结合附图,根据以下详细描述,本公开的各种示例实施例的以上和其他方面、特征和优点将变得更加明显,其中相似的附图标记指代相似的元件,并且其中:
图1是示出根据各种示例实施例的示例电子设备操作环境的框图;
图2是示出根据示例实施例的处理器的示例的框图;
图3是示出根据示例实施例的QA处理方法的示例的流程图;
图4是示出根据示例实施例的用于生成附加信息的方法的示例的流程图;
图5是示出根据示例实施例的用于生成附加信息的方法的另一示例的流程图;
图6是示出根据示例实施例的用于输出描述性答案的方法的示例的流程图;
图7是示出根据示例实施例的用于输出描述性答案的方法的另一示例的流程图;
图8是示出根据示例实施例的用于输出描述性答案的方法的另一示例的流程图;
图9是示出根据示例实施例的信息输出方法的示例的流程图;
图10a是示出根据示例实施例的QA处理方法的另一示例的流程图;
图10b是示出根据示例实施例的QA处理方法的另一示例的流程图;
图11是示出根据示例实施例的电子设备的示例形式的图;
图12是示出根据示例实施例的电子设备的示例硬件组件的框图;
图13是示出根据示例实施例的电子设备的示例软件组件的框图。
图14是示出根据各种示例实施例的程序模块的示例配置的框图;和
图15是示出根据示例实施例的电子设备的示例语音识别和输出的图。
应注意的是,贯穿附图,相似的附图标记用来描绘相同或相似的元件、特征和结构。
具体实施方式
可以参考附图描述本公开的各种示例实施例。因此,本领域的普通技术人员将认识到,在不脱离本公开的范围和精神的情况下,本文描述的各种示例实施例的修改、等同物和/或替代可以被不同地进行。关于附图的描述,类似的元件可以由类似的附图标记来标记。
在本文公开的公开中,本文使用的表述“具有”、“可以具有”、“包括”和“包含”、或“可以包括”和“可以包含”指示对应特征(例如,诸如数值、功能、操作或组件的元件)的存在,但不排除附加特征的存在。
在本文公开的公开中,本文使用的表述“A或B”、“A或/和B中的至少一个”、或“A或/和B中的一个或多个”等可以包括相关联的所列项目中的一个或多个的任何和所有组合。例如,术语“A或B”、“A和B中的至少一个”或“A或B中的至少一个”可以指代以下所有情况:情况(1)包括至少一个A的情况,情况(2)包括至少一个B的情况,或情况(3)包括至少一个A和至少一个B两者的情况。
这里使用的诸如“第一”、“第二”等的术语可以指代各种示例实施例的各种元件,但不限制这些元件。此外,可以使用这些术语来区分一个元件和另一个元件。例如,“第一用户设备”和“第二用户设备”可以指示不同的用户设备,而不管其顺序或优先级。例如,“第一用户设备”和“第二用户设备”指示不同的用户设备。
将理解的是,当元件(例如,第一元件)被称为“(可操作地或通信地)与另一元件(例如,第二元件)耦合/(可操作地或通信地)耦合到另一元件(例如,第二元件)”或“连接到”另一元件(例如,第二元件)时,它可以是直接地与另一元件耦合/耦合到另一元件或连接到另一元件或介入元件(例如,第三元件)可以存在。另一方面,当元件(例如,第一元件)被称为被“直接与…耦合/直接耦合到”或“直接连接到”另一元件(例如,第二元件)时,应该理解的是,不存在介入元件(例如,第三元件)。
根据情况,本文所用的表述“被配置为”可被用作,例如,表述“适合于”、“具有…的能力”、“被设计成”、“被适配于”、“被做成”、或“能够”。术语“被配置为”不可以仅意味着硬件中“专门设计”。相反,表述“被配置为…的设备”可能意味着该设备“能够”与另一个设备或其他组件一起操作。例如,CPU,“被配置为执行A、B和C的处理器”可以指代,例如,用于执行相应操作的专用处理器(例如,嵌入式处理器)或通用处理器(例如,中央处理单元(central processing unit,CPU)或应用处理器),其可以通过运行被存储在存储器设备中的一个或多个软件程序来执行相应的操作。
本公开中使用的术语被用于描述各种示例实施例,并且不旨在限制本公开的范围。除非另有说明,单数形式的术语可以包括复数形式。除非本文另外定义,否则本文使用的包括技术术语或科学术语的所有术语可以具有本领域技术人员通常理解的相同含义。应进一步理解的是,除非在本公开的各种示例性实施例中明确地如此定义,否则在词典中定义并且通常使用的术语也应当被解释为相关的相关领域中的惯例并且不以理想化或过度正式的方式被解释。在一些情况下,即使术语是在说明书中定义的术语,它们也可能不被解释为排除本公开的实施例。
根据本公开的各种示例实施例的电子设备可以包括以下中的至少一个:智能电话、平板个人计算机(personal computer,PC)、移动电话、视频电话、电子书阅读器、台式PC、膝上型PC、上网本计算机、工作站、服务器、个人数字助理(personal digitalassistants,PDA)、便携式多媒体播放器(portable multimedia players,PMP)、运动图像专家组(MPEG-1或MPEG-2)音频层3(MP3)播放器、移动医疗设备、相机、可穿戴设备(例如,头戴式设备(head-mounted-devices,HMD),诸如电子眼镜)、电子服装、电子手镯、电子项链、电子装饰品、电子纹身、智能手表等,但不限于此。
根据另一示例实施例,电子设备可以是家用电器。家用电器可以包括以下中的至少一个:例如,电视机(TV)、数字多功能盘(digital versatile disc,DVD)播放器、音响、冰箱、空调、清洁器、烤箱、微波炉、洗衣机、空气净化器、机顶盒、家庭自动化控制面板、安全控制面板、电视盒(例如Samsung HomeSyncTM,Apple TVTM或Google TVTM)、游戏控制台(例如XboxTM或PlayStationTM)、电子词典、电子钥匙、摄像机、电子相框等,但不限于此。
根据另一示例实施例,电子设备可以包括以下中的至少一个:医疗设备(例如,各种便携式医疗测量设备(例如,血糖监测设备、心脏测量设备、血压测量设备、体温测量设备等))、磁共振血管造影术(magnetic resonance angiography,MRA)、磁共振成像(magneticresonance imaging,MRI)、计算机断层扫描(computed tomography,CT)、扫描仪和超声设备)、导航设备、全球定位系统(global positioning system,GPS)接收器、事件数据记录器(event data recorder,EDR)、飞行数据记录器(flight data recorder,FDR)、车辆信息娱乐设备、用于船舶的电子设备(例如,导航系统和陀螺罗经)、航空电子设备、安全设备、用于车辆的头单元、工业或家用机器人、自动取款机器(automatic teller’s machines,ATM)、销售点(points of sales,POS)或物联网(例如,灯泡、各种传感器、电表或气表、洒水设备、火警器、恒温器、路灯、烤面包机、健身器材、热水箱、加热器、锅炉等)等,但不限于此。
根据另一个示例实施例,电子设备可以包括以下中的至少一个:家具或建筑物/结构的部分、电子板、电子签名接收设备、投影仪或各种测量仪器(例如,水表、电表、气表或者波浪仪等)。在各种实施例中,电子设备可以是上述各种设备之一或其组合等,但是不限于此。根据示例实施例的电子设备可以是柔性设备。此外,根据示例实施例的电子设备可以不限于上述电子设备,并且可以包括其他电子设备和根据技术的发展的新电子设备。
在下文中,可以参照附图描述根据各种示例实施例的电子设备。本文使用的术语“用户”可以指代使用电子设备的人或者可以指代使用电子设备的设备(例如,人工智能电子设备)。
图1是示出根据各种示例实施例的示例电子设备操作环境的框图。
参考图1,电子设备操作环境10可以包括,例如,电子设备100和/或至少一个外部电子设备200。电子设备100可以接收,诸如,例如用户命令(例如,文本或语音)的输入并且可以响应于分析所接收的命令而输出答案。在此操作中,电子设备100可以例如向至少一个外部电子设备200发送答案或与获得该答案相关联的链接信息(例如,统一资源定位符(uniform resource locator,URL)地址信息、声音快速响应(quick response,QR)信息等)。外部电子设备200可以输出响应或链接信息。外部电子设备200可以响应于接收到输入(例如,用户输入)或电子设备100的控制信号(例如,用于请求外部电子设备200输出与链接信息相关联的响应的信号)而输出答案。关于输出链接信息,外部电子设备200可以基于嵌入其中的通信模块从另一个设备(例如,另一个外部电子设备,或可以提供响应的服务器)接收并输出响应。根据各种示例实施例,外部电子设备200可以包括可以接收语音信号的音频设备。如果接收到语音信号,则外部电子设备200可以将接收到的语音信号发送到电子设备100。
在各种示例实施例中,电子设备100可以包括处理器120、存储器130、输入设备(例如,包括输入电路)150、通信接口(例如,包括通信电路)170、输出设备(例如,音频设备110和/或显示器160)、传感器180(例如,相机或图像传感器)和总线115。另外地或可替代地,如果电子设备100以指定形式(例如,机器人)制造,则其还可以包括运动模块190。此外,存储器130可以包括,例如,问题数据库131、答案数据库133和/或用户信息135。
上述电子设备100可以基于音频设备110、输入设备150或通信接口170收集,例如,命令(例如,其用户的命令),并且可以输出对于所收集的命令的答案。在该操作中,电子设备100可以收集与用户相关联的语境信息,并且可以基于收集的语境信息来改变要输出的答案的类型、要输出的答案的形式和/或将输出答案的设备。电子设备100可以基于收集的语境信息经由至少一个指定的设备(例如,电子设备100或外部电子设备)来输出简短的答案或者描述性答案中的至少一个。
存储器130可以包括易失性存储器和/或非易失性存储器。存储器130可以存储,例如,与电子设备100的组件中的至少另一个相关联的命令或数据。根据示例实施例,存储器130可以存储软件和/或程序(未示出)。该程序可以包括,例如内核、中间件、应用编程接口(application programming interface,API)和/或至少一个应用程序(或“至少一个应用”)等。内核、中间件或API的至少一部分可以被称为操作系统(operating system,OS)。
内核可以控制或管理,例如,用于运行在其他程序(例如,中间件,API或应用程序)中实现的操作或功能的系统资源(例如,总线110、处理器120或存储器130等)。而且,在中间件、API或应用程序访问电子设备100的单独组件时,内核可以提供可以控制或管理系统资源的接口。
中间件可以扮演一个角色,作为例如中间人,使得API或应用程序与内核通信以传递数据。
而且,中间件可以按照优先级的顺序来处理从应用程序接收的一个或多个工作请求。例如,中间件可以将可以使用电子设备100的系统资源(总线110、处理器120或存储器130等)的优先级分配给至少一个应用程序中的至少一个。例如,中间件可以通过按照分配给至少一个应用程序中的至少一个的优先级的顺序处理一个或多个工作请求来执行对于一个或多个工作请求的调度或负载平衡。
API可以是,例如,其中应用程序控制从内核或中间件提供的功能的接口。例如,API可以包括用于文件控制、窗口控制、图像处理或文本控制等的至少一个接口或功能(例如,命令)。
存储器130可以存储,例如,与操作电子设备100相关联的操作系统(OS)等。而且,存储器130可以存储与分析用户语音和用户命令相关联的分析程序。根据示例实施例,存储器130可以结合支持QA服务来存储问题数据库131和/或答案数据库133。
问题数据库131可以包括,例如,用于各种简短答案问题或各种描述性问题的数据。就这一点而言,问题数据库131可以包括映射到关于至少一个简短答案的问题的信息。此外,问题数据库131可以包括映射到关于至少一个描述性答案的问题的信息。就这一点而言,问题数据库131可以以被映射到答案数据库133的形式来操作。
根据各种示例实施例,问题数据库131可以包括问题的属性信息。属性信息可以包括主分类中包括的至少一个项目以及与主分类中包括的项目相关的子分类中包括的至少项目。例如,问题数据库131可以包括与“经济、政治、体育、游戏、电影、音乐、娱乐、生活”等相关联的属性信息,作为主分类的项目。此外,问题数据库131可以包括与每个主分类的子分类相关联的属性信息。与子分类相关联的属性信息可以包括根据基于区域的分类的子分类和根据基于类型的分类的子分类。根据示例实施例,与主分类的项目对应的“经济”可以包括诸如“家庭经济、地方经济或国民经济”的基于区域的子分类。与主分类的项目对应的“经济”可以包括诸如“汽车、房地产、现金或债券”的基于类型的子分类。根据各种示例实施例,作为主分类的项目的提升(lift)的子分类可以包括“食物、运动、学习、休闲、健康等”。被分类到上述主分类或子分类中的属性信息可以根据系统设计方案、策略等以分类的形式变化。例如,存储在上述问题数据库131中的属性信息可以用于确定通过用户语音分析所分析的问题的属性。
答案数据库133可以包括,例如,对于至少一个问题的简短答案和/或描述性答案。答案数据库133可以包括映射到存储在问题数据库131中的至少一个问题的简短答案或映射到至少一个问题的描述性答案。答案数据库133可以包括关于简短答案或描述性答案的属性信息。简短答案或描述性答案可以包括与关于在问题数据库131中描述的分类的属性信息类似的信息。根据各种示例实施例,关于答案/问题的属性信息可以包括答案的文本长度、指示包括特殊字母的信息、类别或其组合。
根据各种示例实施例,描述性答案可以包括,例如,时间序列答案或某一长度的或更长的非时间序列答案。时间序列答案可以包括分类为至少一个阶段的答案。结合时间序列答案,答案数据库133可以包括条件信息。条件信息可以包括用于输出时间序列答案中的下一阶段答案的条件。根据示例实施例,条件信息可以包括传感器信息或语音信息。
此外,存储器130可以存储,例如,用户信息135。用户信息135可以包括关于用户年龄的信息、指示他或她是否已婚的信息、关于他或她的工作的信息、关于他或她的位置的信息、关于他或她的高度的信息、关于他或她的体重的信息、关于他或她的孩子的信息、关于他或她最喜欢的食物的信息、关于他或她的爱好的信息、关于他或她的专长的信息和/或他或她的健康信息。上述用户信息135可以是用户输入的信息。用户的健康信息等可以包括基于由传感器180收集的生物信息产生的信息。
根据各种实施例,存储器130可以存储由传感器180收集的传感器信息。所存储的传感器信息可以包括与用户的活动或形式或他或她周围的环境相关联的至少一个信息。传感器信息可用于收集用户的面部标识信息、他或她的操作信息(或根据用户操作的电子设备100的移动信息)、他或她的高度信息、关于他或她所持有的对象的信息、有关他或她穿戴的对象的信息、关于位于他或她周围的对象的信息、温度信息、湿度信息、天气信息或关于他或她所处位置点的信息(例如,关于他或她的家或办公室的信息以及关于他或她家的客厅、浴室和厨房的信息)。
输入设备150可以包括各种输入电路,例如,可以在电子设备100上生成输入信号的至少一个设备。输入设备150可以包括各种输入电路,诸如,例如但不限于,至少一个按钮、操纵杆、触摸板、触摸面板、键盘等。响应于用户输入,输入设备150可以生成与打开或关闭电子设备100相关联的输入信号、与激活或去激活QA服务相关联的输入信号等。根据各种示例实施例,响应于用户输入,输入设备150可以生成用于输出答案或链接信息的外部电子设备选择信号。就这一点而言,电子设备100可执行搜索外部电子设备200的功能和/或输出列表的功能。
音频设备100可以包括,例如,至少一个麦克风和/或至少一个扬声器。麦克风可用于收集用户的语音。麦克风可以在供电时处于常开(always-on)状态。基于分析传感器180的信息,如果用户在一定距离内接近麦克风,则麦克风可以被激活。说话者可以用于输出与答案相对应的音频信息。
显示器160可以包括,例如,液晶显示器(liquid crystal display,LCD)、发光二极管(light emitting diode,LED)显示器、有机LED(organic LED,OLED)显示器、微机电系统(microelectromechanical systems,MEMS)显示器或电子纸显示器等,但不限于此。显示器160可以向用户显示例如各种内容(例如,文本、图像、视频、图标或符号等)。显示器160可以包括触摸屏,并且可以接收使用电子笔或用户的身体的一部分输入的例如触摸、手势、接近或悬停。
显示器160可以输出,例如,与操作电子设备100相关联的信息。根据示例实施例,显示器160可以输出与操作电子设备100相关联的至少一个菜单项等。显示器160可以输出至少一个找到的外部电子设备200的列表。显示器160可以输出将答案或链接信息发送到外部电子设备200的屏幕等。
通信接口170可以包括被配置为在例如电子设备100和外部设备(例如,外部电子设备200或服务器)之间建立通信的各种通信电路。例如,通信接口170可以包括各种通信电路以通过无线通信或有线通信连接到网络,并且可以与外部设备(例如,第二外部电子设备或服务器)通信。
无线通信可以使用,例如,长期演进(long term evolution,LTE)、高级LTE(LTE-advanced,LTE-A)、码分多址(code division multiple access,CDMA)、宽带CDMA(wideband CDMA,WCDMA)、通用移动电信系统(universal mobile telecommunicationssystem,UMTS)、无线宽带(wireless broadband,WiBro)或全球移动通信系统(globalsystem for mobile communications,GSM)等中的至少一个作为蜂窝通信协议。无线通信可以包括例如局域通信。局域通信可以包括,例如,无线保真(wireless-fidelity,Wi-Fi)通信、蓝牙(BT)通信、近场通信(near field communication,NFC)或全球导航卫星系统(global navigation satellite system,GNSS)通信等中的至少一个。
MST模块可以使用电磁信号基于发送数据生成脉冲,并且可以基于脉冲生成磁场信号。电子设备100可以将磁场信号输出到销售点(POS)系统。POS系统可以通过使用MST阅读器检测磁场信号并将检测到的磁场信号转换成电信号来恢复数据。
根据可用区域或带宽等,GNSS可以包括例如,以下中的至少一个:全球定位系统(GPS)、格洛纳斯(Glonass)、北斗导航卫星系统(以下称为“北斗”)或伽利略(即,欧洲全球卫星导航系统)。在下文中,本文使用的“GPS”可以与“GNSS”互换。有线通信可以包括以下中的至少一个,例如,通用串行总线(universal serial bus,USB)通信、高清晰度多媒体接口(high definition multimedia interface,HDMI)通信、推荐标准232(recommendedstandard 232,RS-232)通信或普通老式电话服务(plain old telephone service,POTS)通信等。网络可以包括电信网络,例如,计算机网络(例如,局域网(local area network,LAN)或广域网(wide area network,WAN))、因特网或电话网络中的至少一个。
通信接口170可以包括被配置为支持例如电子设备100的通信功能的各种通信电路。通信接口170可以接收来自用户的命令,并且可以支持与搜索至少一个外部电子设备200相关联的扫描功能、与至少一个选择的外部电子设备200建立通信信道的功能、向外部电子设备发送答案或链接信息的功能等。根据各种示例实施例,通信接口170可以接收由外部电子设备200收集的用户语音信号或命令。
关于支持上述功能,通信接口170可以包括通信电路,诸如短距离无线通信模块,该短距离无线通信模块可以与至少一个外部电子设备200在短距离处建立通信信道。根据各种示例实施例,通信接口170可以包括各种通信电路,该通信电路被配置为执行将语音分析信息发送到服务器并从服务器接收与语音分析信息相对应的答案的功能。通信接口170可以包括被配置为向外部电子设备200发送语音命令并且可以从外部电子设备200接收与所发送的语音命令相对应的答案的通信电路。关于执行上述功能,通信接口170可以包括各种通信电路,诸如,例如但不限于,移动通信模块、用于支持因特网通信的通信模块等。
传感器180可以收集,例如,与用户相关联的各种传感器信息。传感器180可以包括图像传感器、接近传感器、触觉传感器、照明传感器、温度传感器、湿度传感器、生物传感器、加速度传感器、地磁传感器等。根据示例实施例,传感器180可以收集以下中的至少一个:关于用户的面部、瞳孔或身体的图像信息、关于他或她所穿的衣服或包或他或她所持有的对象的图像信息、他或她的操作信息、来自他或她的距离信息、他或她周围的温度信息、他或她周围的湿度信息、或者他或她的位置信息。传感器信息可被提供以验证(或确认、确定或识别)语境信息。
如果电子设备100具有需要移动电子设备100的指定形式(例如,机器人),则运动模块190可以被包括在电子设备100中。运动模块190可以被配置为在某一方向上执行电子设备100的至少一部分的直线运动或曲线运动。这样的运动模块190可以包括至少一个齿轮、心轴、带或轮。
处理器120可以包括中央处理单元(CPU)、应用处理器(application processor,AP)和/或通信处理器(communication processor,CP)中的一个或多个。处理器120可以运行,例如,关于电子设备100的至少另一个部件的控制和/或通信的计算或数据处理。上述处理器120可以分析用户命令并且可以基于分析的数据输出答案或与答案有关地生成的附加信息中的至少一个。
示例实施例被例示为诸如处理器120、存储器130、输入设备150、通信接口170、输出设备(例如,音频设备110和/或显示器160)、传感器180或运动模块190的所有组件被包括在一个电子设备100中。然而,各种实施例不限于此。例如,基于电子设备100的角色、功能或性能,处理器120、存储器130、输入设备150、通信接口170、输出设备(例如,音频设备110和/或显示器160)、传感器180或运动模块190的至少一部分可以在电子设备100和外部电子设备200中被划分和实现。
电子设备100和外部电子设备200中的每一个可以是相同的或不同的设备。根据示例实施例,服务器可以包括一个或多个服务器的组。根据各种示例实施例,电子设备100中运行的全部或一些操作可以在另一电子设备或多个电子设备(例如,外部电子设备200或服务器)中运行。根据示例实施例,如果电子设备100应该自动地或根据请求执行任何功能或服务,则其可以请求另一设备(例如,外部电子设备200或服务器)执行功能或者服务的至少一部分,而不是为其自身运行功能或服务或除功能或服务之外。其他电子设备(例如,外部电子设备200或服务器)可以运行所请求的功能或附加功能,并且可以将运行结果发送到电子设备100。电子设备100可以无变化地或额外地处理接收到的结果,并且可以提供所请求的功能或服务。为此,例如,可以使用云计算技术、分布式计算技术或客户端-服务器计算技术。
图2是示出根据示例实施例的处理器的示例的框图。
参照图2,根据实施例的处理器120可以包括问题处理模块121、附加信息生成模块123、输出模块125和运动控制模块127。在各种实施例中,处理器120的组件中的至少一个可以从处理器120中省略,或者另一个组件可以附加地被包括在处理器120中。各种模块可以用硬件(例如,电路)、软件、固件或这些的组合来实现。
问题处理模块121可以经由图1的音频设备110或通信接口170来收集,例如,用户命令信号。就这一点而言,问题处理模块121可以控制音频设备110的激活或去激活。当从图1的外部电子设备200接收到发送用户命令信号的请求时,问题处理模块121可以接收用户命令信号并且可以分析所接收的用户命令信号。问题处理模块121可以识别针对所收集的命令信号的命令并且可以将命令转换为文本。问题处理模块121可以从转换的文本中提取重要的词语,可以分析提取的词语、后置词等,并且可以提取与问题相关联的答案。就这一点而言,问题处理模块121可以使用问题数据库131和/或答案数据库133。
根据各种示例实施例,问题处理模块121可省略将经由通信接口130以文本形式接收的问题转换为文本。根据示例实施例,外部电子设备200可以收集用户语音信号,可以将收集的用户语音信号转换为文本并且可以将文本发送给电子设备100。例如,外部电子设备200可以获得由其麦克风收集的音频信号的噪声水平的信息。如果噪声水平大于或等于指定水平,则外部电子设备200可以过滤所获得的音频信息的噪声,可以将过滤的音频信息转换成文本,并且可以将文本发送到电子设备100。
根据各种示例实施例,问题处理模块121可以获得收集到的音频信息中的噪声水平的信息。如果噪声水平大于或等于某一水平,则问题处理模块121可以输出用于输入文本的用户界面。问题处理模块121可以确定说出所收集的语音信号的位置与图1的电子设备100之间的距离大于或等于指定的分离距离。如果分离距离大于或等于指定距离,则问题处理模块121可以输出用于输入文本的用户界面。根据各种示例实施例,问题处理模块121可以识别存储的用户信息并且可以输出与自动输入文本相关联的用户界面。例如,问题处理模块121可以获得建立通信信道的外部电子设备200的用户信息。如果外部电子设备200的用户是不能输入语音命令的用户,则问题处理模块121可以输出与自动输入文本相关联的用户界面。
根据各种示例实施例,问题处理模块121可以使用问题数据库131和/或答案数据库133来确定问题的属性信息和/或答案的属性信息中的至少一个。根据各种示例实施例,如果在问题数据库131和/或答案数据库133中不存在与分析的问题相对应的数据,则问题处理模块121可以将数据发送到服务器,并且可以收集与数据相对应的答案或链接信息、服务器的地址信息或存储在服务器中的存储位置信息。问题处理模块121可以收集存储与所分析的问题相对应的答案的电子设备100的地址信息或链接信息。
问题处理模块121可以控制图1的传感器180的激活。例如,如果收集到用户命令信号,则问题处理模块121可以激活传感器180并且收集语境信息。根据示例实施例,问题处理模块121可以收集用户的面部识别信息、距离信息(例如,关于电子设备100与用户之间的分离距离的信息)、关于由他或她的面部观察的方向的信息、关于用户所在位置的信息等。
附加信息生成模块123可以基于与获得的答案或问题相关联的属性信息生成例如附加信息。附加信息生成模块123可以收集属于所获得的答案的分类(或类别)的另一信息。如果答案的属性信息是关于金钱的,则附加信息生成模块123可以生成属于经济分类的另一个答案,例如关于股票市场的状况或房地产的状况的信息作为附加信息。如果答案的属性信息是关于食物的,则附加信息生成模块123可以生成与被找到的食物相关联的另一类型的食物作为答案或生成所找到的食物的特征作为附加信息。
根据各种示例实施例,附加信息生成模块123可以基于属性信息和语境信息生成对应于指定条件的附加信息。例如,如果找到与长度相关联的答案,则附加信息生成模块123可以从语境信息获得用户的高度信息,并且可以生成关于所获得的高度信息与长度之间的相关性的附加信息。根据示例实施例,如果问题是关于珠穆朗玛峰的高度并且如果对该问题的答案是8848m,则附加信息生成模块123可以生成用户的高度与珠穆朗玛峰的高度之间的关系(例如,比率)作为附加信息。用户的高度可以从先前输入的用户信息中获得,或者可以通过分析由传感器180(例如,图像传感器)捕获的用户的图像来获得。
根据各种示例实施例,如果找到特定人的姓名作为对关于指定人的问题的答案,则附加信息生成模块123可以生成关于对应的人与用户之间的关系(例如,具有相同的姓氏的人、毕业于同一所学校的人等)的信息作为附加信息。在该操作中,如果找到具有相同姓氏或从同一所学校毕业的多个人,则附加信息生成模块123可以选择具有某一等级或更高等级意识的人,可以收集关于选择的人的个人信息以生成收集的个人信息作为附加信息。例如,附加信息生成模块123可以将人的姓名发送给服务器,并且可以生成关于使用对应的姓名找到的人中找到若干次或更多次的人的个人信息作为附加信息。
根据各种示例实施例,如果找到特定电子设备的名称作为对于关于电子设备的问题的答案,则附加信息生成模块123可以生成所找到的电子设备与用户的电子设备之间的关系(例如,指示所找到的电子设备是否与用户的电子设备交互的信息、版本信息等)作为附加信息。或者,附加信息生成模块123可以生成使用找到的电子设备作为附加信息的方法。附加信息生成模块123可以基于找到的电子设备的价格信息、尺寸信息等来生成附加信息。
根据各种示例实施例,附加信息生成模块123可以基于答案历史生成附加信息。例如,附加信息生成模块123可以将提问问题和对相应的问题的答案作为历史进行管理。根据示例实施例,电子设备100可以执行存储在图1的存储器130中的电子书(e-book)阅读功能。在这个示例中,电子设备100可以存储和管理关于用户何时阅读任何电子书的数据。如果发生读取新书的请求,则附加信息生成模块123可以生成与包含在新书中的词语相关联的描述、图片或音频信息作为附加信息。例如,附加信息生成模块123可以生成与包含在新书中的特定词语相关联并且被包括在具有先前有阅读历史的书中的图像作为附加信息。
根据各种示例实施例,附加信息生成模块123可以根据用户对用户信息进行分类,并且可以结合答案历史来存储和管理分类的用户信息。例如,附加信息生成模块123可以收集每个家庭成员的用户信息(例如,针对每个用户的个人信息、用于区分说话者的音频特征信息、偏好信息、关于针对每个用户的正在被操作的电子设备的信息等)。附加信息生成模块123可以根据用户对答案历史进行分类并且可以存储和管理分类的答案历史,同时提供针对每个用户询问的问题和对相应的问题的答案。
当选择了对特定用户的问题的答案时,附加信息生成模块123可以基于对应的用户的等级(或关系、位置等)以不同方式生成附加信息。例如,附加信息生成模块123可以以不同方式生成与家庭成员中的父亲或母亲的问题和答案相关联的附加信息以及与儿子或女儿的问题和答案相关联的附加信息,并且可以输出生成的附加信息。根据示例实施例,如果小学生询问关于明天日程安排,则答案可以是上课出勤,并且附加信息生成模块123可以生成课程表作为附加信息。如果有小学生的母亲询问明天日程安排,则答案可以是与小学生的答案相同的上课出勤,附加信息生成模块123可生成包括小学生的课程表和与交通指导有关联的日程表的附加信息。
根据各种示例实施例,当生成与运动相关联的附加信息时,附加信息生成模块123可以基于用户信息提供差异化的信息。附加信息生成模块123可以基于用户信息生成附加信息,在附加信息中,以不同的方式设置要执行的运动形式或运动的目标量。例如,如果接收到关于瑜伽姿势的问题项目,则电子设备100可以输出关于各种瑜伽姿势的答案(例如,文本信息、音频信息或图像信息中的至少一个)。附加信息生成模块123可以基于用户信息提供相对容易的瑜伽姿势或相对困难的瑜伽姿势作为附加信息。附加信息生成模块123可以基于每个用户的运动历史、常规运动的量等,提供不同的瑜伽姿势作为附加信息。
根据各种示例实施例,当生成与运动相关联的附加信息时,附加信息生成模块123可以基于答案历史生成附加信息。例如,当执行新的运动时,附加信息生成模块123可以获得先前执行的运动历史(例如,通过答案历史获得)并且可以生成附加信息以指代与新的运动姿势或操作相关的类似运动姿势或操作。就这一点而言,附加信息生成模块123可以提取用于新的运动姿势或操作的特征点,并且可以搜索具有指定级别或更高级别的匹配率的运动姿势或操作的历史。如果存在多个找到的信息,则附加信息生成模块123可以首先提供具有高匹配率的运动姿势或操作,或者可以以多视图的形式提供所有找到的信息。
根据各种示例实施例,附加信息生成模块123可以结合运动信息为每个阶段提供附加信息。例如,如果发生关于运动的问题,则电子设备100可以输出与各种运动类型相关联的文本描述或图像作为答案。当提供关于各种类型的运动(例如,上推、仰卧起坐、引体向上等)的信息时,附加信息生成模块123可以基于用户信息(例如,用户的身体状况、通常运动的量等)生成相对容易的运动类型或难做的运动类型或运动的量作为附加信息并且可以提供附加信息。
根据各种示例实施例,附加信息生成模块123可以基于用户经常使用的表述来配置文集(analects),并且可以基于该文集生成附加信息。例如,如果生成附加信息,则附加信息生成模块123可以将包括在附加信息中的词语中具有相同含义的词语用包括在用户的文集中的词语替换。因此,附加信息生成模块123可以支持使用用户更熟悉的词语或表述来描述信息。
根据各种示例实施例,当参考与生成附加信息相关联的信息时,附加信息生成模块123可以使用存储在至少一个外部电子设备中的数据库。例如,如果找到与生成附加信息相关联的词语(或句子),则附加信息生成模块123可以将相应的词语发送到至少一个外部电子设备,并且可以从外部电子设备收集与相应的词语相关联的信息。附加信息生成模块123可以将与问题或答案相关联的属性信息发送到外部电子设备,并且可以在存储在外部电子设备中的信息之中收集与属性信息相对应的信息。
附加信息生成模块123可以基于问题或答案的属性信息来选择指定的外部电子设备,并且可以共享所选择的外部电子设备的数据库。例如,附加信息生成模块123可以共享存储在诸如冰箱、洗衣机、微波炉、电视机(TV)、音频设备、投影仪、台式计算机等的外部电子设备中的至少一个的存储器中的数据库,这些外部电子设备是连接的或者可以通过通信信道连接。就这一点而言,电子设备100可以针对每个属性信息存储和管理映射至少一个外部电子设备的映射列表。附加信息生成模块123可以基于收集的信息或共享的数据库生成附加信息。
输出模块125可以例如将对问题的答案输出到指定的设备(例如,外部电子设备200)。输出模块125可以将找到的答案转换为语音信号并且可以经由图1的音频设备110输出转换后的音频信号。输出模块125可以经由外部电子设备200的音频设备输出找到的答案。根据示例实施例,如果在相对于用户被布置的位置的某一距离内存在外部电子设备200,则输出模块125可以控制外部电子设备200经由对应的外部电子设备200输出答案。当输出答案时,输出模块125可以向多个指定的设备(例如,至少一个外部电子设备200)输出答案(例如,输出答案作为音频信息或屏幕信息)。
根据各种示例实施例,输出模块125可以基于对问题的答案的特征来改变要输出的答案的形式。例如,如果找到的答案是简短答案,则输出模块125可以将答案转换为语音信号并且可以通过音频设备110输出转换后的音频信号。如果找到的答案是描述性答案,则输出模块125可以将答案输出为屏幕信息(为此目的,将语音信号转换为文本并输出文本),同时将相应的答案转换为语音信号并输出语音信号。而且,输出模块125可以基于对问题的答案的特征来确定是否满足指定的条件。如果满足指定的答案,则输出模块125可以将相应的答案输出到指定的设备(例如,外部电子设备200)。如果找到时间序列答案,则输出模块125可输出部分答案。如果满足指定的条件(例如,其中获得指定的语境信息的条件),则输出模块125可以输出下一个答案。
根据各种示例实施例,如果找到包括图像或公式的答案,则输出模块125可以在设备(例如,电子设备100或至少一个电子设备200)上输出屏幕信息。在这种情况下,输出模块125可以输出提供答案被输出作为屏幕信息的音频信息。输出模块125可以输出提供答案被输出到任何设备(例如,特定外部电子设备200)的通知的音频信息。
根据各种示例实施例,输出模块125可以基于监视的结果来执行输出重试。例如,输出模块125可以分析经由电子设备100的麦克风收集的音频信息,并且可以确定收集了指定形式的音频信息。如果未收集指定形式的音频信息并且如果经过了指定的时间,则输出模块125可以再次输出先前输出的信息。根据示例实施例,输出模块125可以间隔地分类并输出指定歌曲。输出模块125可以在第一时间间隔期间输出歌曲,并且可以收集由用户说出的音频信息。如果音频信息的形式与指定的形式相同,则输出模块125可以在随后的第二间隔期间输出该歌曲。根据各种示例实施例,输出模块125可以以不同方式对针对每个用户信息收集的音频信息应用比较标准。例如,输出模块125可以基于用户的歌唱事业(例如,通过用户输入获得)、先前的唱歌历史(例如,每首歌曲的分数历史)等,以不同的方式应用指定形式的条件。如果歌唱事业或之前的唱歌历史相对较少,则输出模块125可提供相对更低(或更弱)的条件。因此,尽管用户唱得相对差(例如,虽然节拍或音调错误很多次),但是输出模块125可以通过当前间隔并且可以输出下一个间隔。
根据各种示例实施例,电子设备100(例如,处理器120的问题处理模块121)可以使用组装块接收与游戏相关的问题,并且可以获得每个阶段的组装方法作为响应于这个问题的答案。输出模块125可以针对对组装模块组装的形式分析图像,并且可以基于分析的图像确定当前阶段是否是任何组装阶段。输出模块125可输出针对每个组装阶段的下一阶段的组装说明(例如,必要块的形式的描述、必要块的数目以及块应该被布置的位置)。
根据各种示例实施例,输出模块125可以基于收集的语音命令来为每个用户执行分类。输出模块125可以以不同的方式为每个用户输出将要输出的信息的音色、音调、节奏等。例如,如果用户是儿童,则输出模块125可以使用相对响亮声调的语音或以相对慢的速度来输出答案或附加信息。
根据各种示例实施例,输出模块125可以基于输入问题的用户来改变用于输出答案或附加信息的外部电子设备的类型。例如,输出模块125可以向由输入问题的用户使用的电子设备发送答案或附加信息。就这一点而言,输出模块125可以搜索当前连接的用户电子设备或者可以将通信信道和与用户相关地注册的电子设备连接(例如,执行配对)。如果与输入问题的用户相关地注册了多个电子设备,则输出模块125可以将答案或附加信息发送到作为可穿戴设备注册的电子设备。
根据各种示例实施例,输出模块125可以从所连接的电子设备的存储器收集用户信息或用于生成附加信息的信息。输出模块125可以基于语音来输出答案或附加信息。如果诸如图像或公式的信息被包括在答案或附加信息中,则输出模块125可以将对应的答案发送给与用户相关联的电子设备。
运动控制模块127可以控制例如电子设备100的运动功能。如果基于多个麦克风检测到其中用户的语音信号被收集的方向,则运动控制模块127可以控制(例如,旋转或移动)电子设备100,使得电子设备100的正面(例如布置有显示器160的区域或布置有传感器180(例如,照相机或图像传感器)的区域)朝向其中用户的语音信号被收集的方向。如果用户的语音信号是某一等级或更低,则运动控制模块127可以控制电子设备100,使得电子设备100移动到说出用户的语音信号的位置。运动控制模块127可以以关于用户的形式移动以捕捉用户的活动状态。基于以各种角度收集的多个图像,运动控制模块127可以被移动到捕捉指定图像的图像的位置。
根据各种示例实施例,问题处理模块121、附加信息生成模块123、输出模块125和运动控制模块127中的至少一些可以用软件、固件、硬件或者它们的至少两个或更多个组合。问题处理模块121、附加信息生成模块123、输出模块125和运动控制模块127中的至少一些可以由处理器(例如,处理器120)实现(例如,运行)。问题处理模块121、附加信息生成模块123、输出模块125和运动控制模块127中的至少一些可以包括用于执行一个或多个功能的例如模块(例如,包括电路)、程序、例程、指令集、过程等。
根据各种示例实施例,本公开可以提供一种电子设备。该电子设备可以包括通信接口和被配置为在功能上与通信接口连接的处理器,该通信接口包括通信电路,其中处理器被配置为:获得用户的语音信号;与获得语音信号相关地获得与用户相关联的语境信息;如果语境信息满足第一条件,则确定与语音信号对应的第一响应信息,如果语境信息满足第二条件,则确定与语音信号对应的第二响应信息,并且发送与第一响应信息或第二响应信息相对应的至少部分响应信息将发送到与电子设备可操作地连接的输出设备或电子设备的外部电子设备。
根据各种示例实施例,电子设备还可以包括麦克风,其中处理器被配置为使用麦克风从用户接收语音信号。
根据各种示例实施例,处理器被配置为经由通信电路从外部电子设备或另一外部电子设备接收语音信号。
根据各种示例实施例,电子设备可以进一步包括被配置为获取与用户相关联的图像的图像传感器或相机,其中处理器被配置为进一步基于图像来获得语境信息。
根据各种示例实施例,处理器被配置为获得属性信息以区分响应信息的种类或类别、或者内容,并且如果属性信息满足条件,则使用与用于提供答案信息的方法不同的方法来提供答案信息。
根据各种示例实施例,该方法可以包括用于通过声音提供答案信息的方法,并且其中处理器被配置为如果属性信息满足条件则将答案信息提供为图像或文本。
根据各种示例实施例,属性信息包括答案信息的文本长度、指示是否包括特殊字符的信息、类别或其组合,并且其中处理器被配置为基于属性信息的至少一部分来生成与条件相对应的信息。
根据各种示例实施例,本公开可以提供一种电子设备。电子设备可以包括被配置为获取语音信号的音频设备,被配置为存储与语音信号相关联的问题或答案的存储器以及被配置为与音频设备或存储器可操作地连接的处理器,其中处理器被配置为:将所获得的语音信号转换成文本,基于存储在存储器中的数据搜索与转换后的文本对应的问题或与该问题对应的答案,获得找到的问题或答案的属性信息,基于答案和属性信息生成附加信息并输出答案或附加信息中的至少一个。
根据各种示例实施例,电子设备可以进一步包括被配置为获得图像的传感器,其中处理器被配置为使用传感器获得图像(例如,外围图像)并且如果分析获得的图像的结果满足条件,输出答案或附加信息中的至少一个。
根据各种示例实施例,处理器被配置为将附加信息转换为语音信号并输出转换后的语音信号。
根据各种示例实施例,处理器被配置为在设备的屏幕上输出附加信息中没有被转换为语音信号的信息。
根据各种示例实施例,处理器被配置为在设备的屏幕上输出与存储附加信息的存储位置相对应的地址信息。
根据各种示例实施例,处理器被配置为输出答案的至少一部分,并等待输出答案的下一部分,直到满足条件。
根据各种示例实施例,处理器被配置为如果满足条件,则输出答案中所输出答案的下一部分,并且如果在条件满足之前接收到其他答案,则输出对另一问题的答案。
图3是示出根据示例实施例的QA处理方法的示例的流程图。
参照图3,结合根据示例实施例的QA处理方法,在操作301中,图2的处理器120(例如,问题处理模块121)可以收集和分析语音。例如,处理器120可以激活图1的音频设备110以收集用户语音信号。处理器120可以经由图1的通信接口170从图1的指定的外部电子设备200接收用户命令信号。如果输入是语音,则处理器120可以基于语音识别功能将语音转换成文本。就这一点而言,图1的电子设备100可以包括语音识别程序和语音识别数据库。处理器120可以从转换的文本中提取主语、宾语、谓语等,并且可以使用所提取的信息组成句子。处理器120可以从转换的文本中提取词语。处理器120可以搜索与基于文本或提取的词语配置的句子相对应的响应。就这一点而言,处理器120可以在图1的问题数据库131和答案数据库133中搜索与提取的问题相对应的答案。根据各种示例实施例,如果在问题数据库131中不存在与问题相对应的数据,则处理器120可以经由通信接口170将提取的问题发送到外部服务器,并且可以从外部服务器接收与该问题相对应的答案。
在操作303中,处理器120(例如,问题处理模块121)可以确定分析的结果是否是指定的简短答案问题。就这一点而言,如上所述,处理器120可以使用问题数据库131来获得答案的长度的信息。如果答案的文本长度在指定长度内(例如,如果答案被配置为一个词语,如果答案是具有一个词语含义的复合词,或者如果答案的文本长度在10个字母以内),则处理器120可以将分析的结果确定为指定的简短答案问题。
如果分析的结果是指定的简短答案的问题,则在操作305中,处理器120(例如,图2的附加信息生成模块123)可以基于问题的属性或简短的答案的属性来生成附加信息。例如,处理器120可以基于问题数据库131或答案数据库133收集关于问题或答案的属性信息。处理器120可以收集与收集的属性信息相同的属性信息(例如,主分类或子分类)相关联的信息作为附加信息。例如,处理器120可以生成属于与属性信息相同的分类的新闻文章、用户搜索历史信息等作为附加信息。
根据各种示例实施例,处理器120可以收集语境信息并且可以生成包括所收集的语境信息和共同的属性信息的附加信息。例如,如果接收到与位置或地名相关联的问题,则处理器120可以收集当前位置信息作为语境信息。处理器120可以生成与当前位置相关联的附加信息(例如,与当前位置相关联的新闻,与当前位置相对应的建筑物或地名信息等)。处理器120可以将答案与语境信息进行比较,并且可以生成对应于比较结果的附加信息。例如,如果接收到与高度、长度或区域相关联的问题,则处理器120可以收集用户信息作为语境信息。处理器120可以将用户信息与问题或答案信息进行比较,并且可以生成比较结果作为附加信息。
在操作307中,处理器120(例如,图2的输出模块125)可以输出简短答案或附加信息中的至少一个。例如,处理器120可以生成对应于简短答案的语音信号并且可以输出生成的语音信号。处理器120可以输出简短答案,可以将附加信息转换为语音信号,并且可以输出与附加信息相对应的语音信号。根据各种示例实施例,在输出简短答案之后,如果满足指定条件,则处理器120可以输出附加信息。在输出简短答案之后,如果用于请求输出附加信息的用户手势发生,则处理器120可以输出附加信息。
如果分析的结果不是指定的简短答案问题,则在操作309中,处理器120(例如,问题处理模块121)可以确定分析的结果是否是指定的描述性问题。例如,如果对应于问题的答案的长度大于或等于指定的长度,如果答案被配置有多个句子,或者如果答案包括指定的数量或更多的词语,则处理器120可以将分析的结果确定为对于描述性答案的描述性问题。
如果分析的结果是指定的描述性问题,则在操作311中,处理器120(例如,输出模块125)可以使用数据库或服务器来获得并输出描述性答案。处理器120可以将描述性答案转换为语音信号并且可以经由图1的音频设备110输出语音信号。处理器120可以搜索至少一个外部电子设备200,并且可以在至少一个找到的外部电子设备200当中来向具有语音信号输出历史的设备或根据用户选择的设备发送语音信号。根据各种示例实施例,处理器120可以生成关于描述性答案的附加信息并且可以选择性地输出所生成的附加信息。当生成关于描述性答案的附加信息时,处理器120可以基于存储在问题数据库131或答案数据库133中的属性信息来生成附加信息。处理器120可以使用图1的传感器180等收集语境信息,并且可以基于收集的语境信息和属性信息生成附加信息。
如果分析的结果不是指定的描述性问题,则在操作313中,处理器120可以以指定方式收集与相应问题相关联的答案,并且可以将答案输出到指定设备(例如,外部电子设备200)。例如,如果答案包括图像、公式等,则处理器120可以配置包括图像或公式的屏幕。处理器120可以在显示器160上输出屏幕,或者可以将屏幕发送到可以经由通信接口170与电子设备100连接的至少一个外部电子设备200。根据各种示例实施例,如果答案包括多个图像或几个公式,则处理器120可以将描述图像或公式的描述信息与图像或公式相同步。在输出特定的图像或公式时,处理器120可输出用于对应的图像和公式的语音信号。如果用于对应的图像或公式的语音信号的输出结束,则处理器120可输出下一图像或公式,并且可以输出对应于下一图像或公式的语音信号。
图4是示出根据示例实施例的用于生成附加信息的方法的示例的流程图。
参照图4,在用于生成附加信息的方法中,在操作401中,图2的处理器120(例如,问题处理模块121)可以从问题或答案收集至少一个属性信息。例如,处理器120可以使用图1的问题数据库131或答案数据库133收集对应于问题或答案的属性信息。如果问题的属性与答案的属性相同,则处理器120可以收集仅一个属性信息。
在操作403中,处理器120(例如,图2的附加信息生成模块123)可以收集与属性信息相对应的语境信息。例如,如果属性信息是指示地理或位置的信息,则处理器120可以收集关于图1的电子设备100的用户的当前位置的信息(例如,他或她居住的家的位置、他或她在家中的位置等)。根据各种实施例,如果属性信息是关于人的信息,则处理器120可以操作图1的传感器180(例如,相机或图像传感器)以获得用户的面部信息。如果属性信息是季节或天气信息,则处理器120可以操作传感器180(例如温度传感器和湿度传感器)以获得关于温度、湿度、照明强度等的信息。
在操作405中,处理器120可以基于语境信息生成附加信息。如果获得语境信息,则处理器120可以生成与基于语境信息获得的答案相关联的附加信息。例如,如果答案是关于指定的地名的信息,则处理器120可以生成从用户的当前位置到指定地点的距离信息作为附加信息。如果答案是关于人的信息,则处理器120可以将人的面部与用户的面部进行比较,并且可以基于匹配程度生成附加信息(例如,面部的相似程度的描述)。如果答案是天气信息,则处理器120可以生成关于当前温度和湿度的信息作为附加信息。
关于生成上述附加信息,电子设备100可以包括与特定答案的属性链接的、定义附加信息的属性的数据库。定义附加信息的属性的数据库可以包括获得与附加信息的属性对应的信息的方法。例如,定义附加信息的属性的数据库可以包括被设计为当生成与位置相关联的附加信息时使用位置传感器的方法、被设计为当生成与人相关联的附加信息时使用面部识别和比较程序的方法、当生成与天气相关联的附加信息时使用温度/湿度传感器的方法等。定义附加信息的属性的数据库可以基于用户设置而改变,或者可以由从指定的服务器提供的数据来更新。
图5是示出根据示例实施例的用于生成附加信息的方法的另一示例的流程图。
参考图5,在用于生成附加信息的方法中,在操作501中,图2的处理器120(例如,问题处理模块121)可以提取答案和问题中的至少一个的属性信息。例如,如果基于图1的答案数据库133得出答案,则处理器120可以从答案数据库133中提取与得出的答案相对应的属性信息。
在操作503中,处理器120(例如,图2的附加信息生成模块123)可以选择对应于属性信息的用户信息。就这一点而言,电子设备100可以存储和管理其中存储在答案数据库133中的属性信息被映射到用户信息中的每一个的表格。根据示例实施例,如果答案的属性是健康,则处理器120可以获得用户信息中的年龄、高度和体重信息。另外,如果答案的属性是体育,则处理器120可以获得用户信息中的爱好信息、特殊能力信息等。如果答案的属性是经济,则处理器120可以基于电子设备100的用户的家庭地址信息来获得房地产信息等。
在操作505中,处理器120可基于所选择的用户和基于指定的规则的答案来生成附加信息。例如,如果每个年龄的健康体重是答案,则处理器120可以生成关于用户的健康状态的信息作为关于他或她的年龄、高度和体重的附加信息。另外,如果今天的棒球的情况是答案,处理器120可生成关于由用户的爱好或偏好所选择的其他运动(例如,足球)队的实绩结果作为附加信息。此外,如果特定的区域的房地产价格是答案,则处理器120可以生成用户当前居住的地区的房地产价格信息作为附加信息。
图6是示出根据示例实施例的用于输出描述性答案的方法的示例的流程图。
参考图6,关于用于输出描述性答案的方法,在操作601中,图2的处理器120(例如,问题处理模块121)可以收集描述性答案。例如,处理器120可以基于与收集的语音信号的分析和分析的结果相对应的图1的问题数据库131和答案数据库133收集映射到相应问题的描述性答案。如果在问题数据库131或答案数据库133中不存在与问题或答案相关联的数据,则处理器120可以经由图1的通信接口170将用户语音信号(或者分析语音信号的结果)发送到服务器并且可以收集对应于用户语音信号的答案。
在操作603中,处理器120(例如,问题处理模块121)可以确定所收集的描述性答案是否是时间序列答案。例如,处理器120可以确定指示时间序列答案的指定的词语(例如,阶段、操作、过程等)是否被包括在描述性答案中。可替换地,处理器120可以确定指示时间序列答案的指定数字(例如“1.1”、“1-1”、“a)和b)”,“A)和B)”等)是否被包含在描述性答案中。处理器120可以确定与该时间序列答案相关联的多个连词是否被包括在该答案中。
如果所收集的描述性答案是时间序列答案,则在操作605中,处理器120(例如,图2的输出模块)可以输出多阶段描述性答案中的第一阶段答案。例如,处理器120可以将从答案的开始部分到某一时段的范围、指定连接之前的范围或指定数字之前的范围确定为第一阶段。处理器120可以将与确定的第一阶段相对应的文本转换为语音信号并且可以输出转换后的语音信号。根据各种示例实施例,如果第一阶段答案配置有语音信号,则处理器120可以将对应于该答案的语音信号输出到指定设备(例如,至少一个外部电子设备200)。根据各种示例实施例,如果答案中包括图像、公式等,则处理器120可以向指定的外部电子设备200提供与对应的图像或者公式相对应的屏幕,或者可以发送与对应的图像或者公式相对应的地址信息(或者链接信息)发送给指定的外部电子设备200。
在输出第一阶段答案之后,在操作607中,处理器120(例如,输出模块125)可以确定是否满足指定的条件。该指定的条件可以包括,例如,确定指定的用户手势信息是否被收集的条件。就这一点而言,处理器120可以操作传感器180(例如,相机或图像传感器)以收集图1的电子设备100的用户的面部、手、身体等的图像,并且可以基于分析相应的图像来确定用户是否执行特定手势。根据各种示例实施例,指定的条件可以包括收集指定的语音信号的条件。在这一点而言,在输出第一阶段答案之后,处理器120可以激活图1的音频设备110以收集用户语音信号并且可以确定收集的语音信号中是否包括与指定的条件相对应的语音信号。
根据各种示例实施例,处理器120可以确定与包括在第一阶段答案中的词语相对应的用户手势(例如,与操作相关联的词语)。如果收集了与包括在相应阶段中的词语相对应的用户手势,则处理器120可以确定是否满足指定的条件。就这一点而言,处理器120可以操作包括在电子设备100中的图像传感器,或者可以从用户持有的电子设备接收传感器信息(例如,加速度传感器信息、地磁传感器信息、心跳信息等)。
如果满足指定条件,则在操作609中,处理器120可以确定下一阶段答案是否是最后阶段答案。如果下一阶段答案是描述性答案的最后阶段答案,则在操作611中,处理器120可以输出最后阶段答案。例如,处理器120可以输出对应于相应答案的语音信号(例如,将文本转换为语音信号并输出转换后的语音信号)。如果下一阶段答案不是最后阶段答案,则在操作613中,处理器120可以输出下一阶段答案,并且可以分支到操作607以从操作607执行操作。
如果在操作607中未满足指定的条件,则在操作615中,处理器120可确定是否发生与结束相关联的事件。如果与结束相关联的事件没有发生,则处理器120可以分支到操作607以从操作607执行操作。例如,处理器120可以实时或在一段时间确定指定的条件是否被满足。
如果操作603中描述性答案不是时间系列答案,则在操作617中,处理器120(例如,图2的附加信息生成模块123)可以基于问题的属性和描述性答案的属性生成附加信息。例如,如果响应于与相应踪迹(trail)相关联的问题接收到与特定的踪迹相关联的描述性答案,则处理器120可基于用户的通常运动的量产生推荐的踪迹作为附加信息。用户的通常运动量可以从保健程序存储的信息中获得。在操作619中,处理器120可以输出描述性答案或附加信息中的至少一个。
根据各种示例实施例,时间序列答案可以包括面食的食谱。在该示例中,处理器120可以在电子设备100的队列(未示出)中输入和输出关于用于准备食谱的材料以及制作面食的顺序的信息的同时监视相机信息和传感器信息,并且可以确定烹饪进行情况。处理器120可以基于每个烹饪阶段的故事讲述来输出答案。在该操作中,处理器120可将回答的内容与当前进展的程度进行比较,并且如果当前阶段的烹饪未结束,则可将下一阶段的故事讲述(例如,下一故事文本)存储在队列(或缓冲器)中。
根据示例实施例,在描述性答案(例如,食谱信息等)的情况下,处理器120可以等待而不在中间完成答案。在该示例中,如果收集用于另一个问题的用户语音信号,则处理器120可以响应于用户语音信号来搜索答案并且可以输出找到的答案。就这一点而言,处理器120可主动改变地描述性答案和附加答案的队列顺序。例如,在其中处理器120在完成了第2个答案之后等待第3个答案而烹饪具有多个阶段的进展的情况下,如果接收到中间问题,则处理器120可以获得并输出对中间问题的答案,并可以再次等待第3个答案。例如,如果在烹饪阶段期间接收到天气问题,则处理器120可以延迟第3个答案的队列并且可以输出当前温度和天气信息。如果对中间问题的答案完成,则处理器120可以将第3个答案的队列恢复到原始位置。在完成第2个答案之后,处理器120可以重新开始监视进展状态(例如,收集并分析用户相关的语境信息)。
图7是示出根据示例实施例的用于输出描述性答案的方法的另一示例的流程图。
参考图7,关于用于输出描述性答案的方法,在操作701中,图2的处理器120(例如,问题处理模块121)可以收集描述性答案。例如,处理器120可以基于图1的问题数据库131和答案数据库133收集对应于收集的语音信号的描述性答案。
在操作703中,处理器120(例如,图2的输出模块125)可以搜索外围外部电子设备。处理器120可以使用包括在图1的通信接口170中的短距离通信模块来搜索位于一定距离内的至少一个外部电子设备。
在操作705中,处理器120可以选择外部电子设备。例如,处理器120可以基于所收集的描述性答案的属性以不同方式选择外围外部电子设备的数量或者外部电子设备的类型。例如,处理器120可以基于描述性答案的整体长度来选择外部电子设备的数量或外部电子设备的类型。根据示例实施例,如果描述性答案的整体长度大于或等于指定的长度,则处理器120可以选择相对更多数量的外部电子设备。如果描述性答案的整体长度小于指定的长度,则处理器120可以选择相对更少数量的外部电子设备。而且,如果描述性答案是具有节奏的答案(例如,四重奏、歌曲等),则处理器120可以选择具有外部的优良的扬声器质量的外部电子设备。
在操作707中,处理器120可以将描述性答案发送给外部电子设备200。就这一点而言,处理器120可以使用短距离通信模块(或支持因特网网络等的通信模块)与外部电子设备200建立通信信道,并且可以基于通信信道将描述性答案发送到外部电子设备200。根据各种示例实施例,QA处理系统可以进一步包括物联网(Internet of things,IoT)集线器(或至少一个处理器)。电子设备100和至少一个外部电子设备200可以与IoT集线器建立通信信道。在这样的环境中,电子设备100可以向IoT集线器发送描述性答案。IoT集线器可以将描述性答案发送给至少一个指定的外部设备200。根据示例实施例,IoT集线器可以确定从电子设备100提供的描述性答案的属性,并且可以基于所确定的属性向至少一个指定的外部电子设备200发送描述性答案。就这一点而言,IoT可以将关于描述性答案的属性的信息以及与由相应属性选择的外部电子设备相关联的映射信息存储在其数据库中。根据各种示例实施例,IoT集线器可以基于从电子设备100提供的描述性答案和至少一个外部电子设备200的列表,将接收到的描述性答案发送到由电子设备100选择的外部电子设备200。电子设备100和至少一个外部电子设备200可以有线地或无线地与IoT集线器连接。
图8是示出根据示例实施例的用于输出描述性答案的方法的另一示例的流程图。
参照图8,关于用于在没有简短答案或描述性答案的情况下输出描述性答案的方法,在操作801中,图2的处理器120(例如,问题处理模块121)可以收集答案地址信息。根据示例实施例,如果对于问题的答案的至少一部分包括图像、公式等,则处理器120可以获得存储答案的位置的地址信息(例如,统一资源定位符(uniform resource locator,URL)信息、声音快速响应(quick response,QR)信息等)。地址信息可以包括图1的电子设备100的答案数据库133的地址信息,其可以存储答案、图1的外部电子设备200的地址信息、指定的服务器的地址信息等。
在操作803中,处理器120可输出地址信息。例如,处理器120可以将地址信息输出到指定的设备(例如,外部电子设备200等)。在输出过程中,处理器120可以输出地址信息作为链接信息。根据实施例,处理器120可以显示与地址信息相对应的链接的信息。当地址信息被选择时,处理器120可以显示与链接的信息有关的屏幕。
在操作805中,处理器120可以获得是否生成与选择地址信息相关联的输入信号的信息。如果生成与选择地址信息相关联的输入信号,则在操作807中,处理器120可以控制对应于地址信息的信息的输出。根据各种示例实施例,处理器120可以在显示器160上输出地址信息。如果在显示器160上发生用于选择相应的地址信息的触摸输入,则处理器120可以在显示器160上输出与地址信息相对应的答案信息。根据各种示例实施例,处理器120可以将地址信息发送到指定的外部设备200。外部电子设备200可以在其显示器上输出所接收的地址信息,并且可以基于用户输入收集并输出与地址信息相对应的答案信息。就这一点而言,外部电子设备200可以基于地址信息与电子设备100、另一个外部电子设备、服务器等建立通信信道,并且可以从相应的设备接收答案信息。根据各种示例实施例,处理器120可以从输出地址信息的外部电子设备接收用户输入信号,并且可以响应于用户输入信号将答案信息发送到外部电子设备。
如果地址信息未被选择,则处理器120可以省略操作807。处理器120可以在指定的时间期间维持地址信息的输出。如果经过了指定的时间,则处理器120可以停止输出地址信息。根据各种示例实施例,处理器120可以存储和管理未被选择的地址信息。处理器120可以基于用户输入在显示器160上输出地址信息的列表。如果用户输入(例如,与选择地址信息相关联的输入)发生,则处理器120可以执行上面的操作807。
图9是示出根据示例实施例的信息输出方法的示例的流程图。
参考图9,在信息输出方法中,在操作901中,图2的处理器120(例如,输出模块125)可以提取其中不可能执行文本到语音(text to speech,TTS)转换的信息。例如,如果基于答案数据库133获得对于问题的答案,则处理器120可以分析所获得的答案并且可以确定其中不可能执行TTS转换的指定的信息(例如,图像、公式、特殊字母等)是否被包含在答案中。如果指定的信息被包括在答案中,则处理器120可以从答案中提取相应的信息。而且,处理器120可以收集指定的信息的内容中的位置。处理器120可以收集位于指定的信息的前端的文本、位于指定的信息的后端的文本等。
在操作903中,处理器120可以将提取的信息与TTS转换信息同步。例如,处理器120可以将除了指定的信息之外可能执行TTS转换的信息转换为语音信号。而且,处理器120可以基于指定的信息的位置信息来执行调整输入转换后的语音信号的时间的同步过程。
在操作905中,处理器120可以在输出TTS转换信息的同时将提取的信息输出到指定的设备。例如,处理器120可以在输出部分转换的语音信号的同时在指定的设备的屏幕上输出与语音信号相关联的指定的信息。如果与指定的信息相关联的语音信号的输出完成,则处理器120处理器120可以在输出后续的指定信息的同时输出与后续的指定的信息相关联的语音信号。
根据各种示例实施例,如果没有找到输出其中难以执行TTS转换的答案的外部电子设备,则处理器120可以使用指定的账户的电子邮件(email)发送相应答案。如上所述,根据各种示例实施例的电子设备100可以经由设备(诸如移动电话和平板个人计算机(PC))使用其中容易由转换表示的推送服务(诸如URL或者声音QR)来表示其中难以用谈话表示的公式、数学证明、描述性答案等。电子设备100可以以URL的形式或者以能够被输出的形式提供其中难以由TTS表示的信息。此外,电子设备100可以将其中很难由TTS表示的信息提供为可以被输出以支持在互联网不与电子设备100连接的离线环境中验证并输出答案的形式的文件(例如,DOC文件、JPG文件、PDF文件等)。
图10a是示出根据示例实施例的QA处理方法的另一示例的流程图。
参考图10a,在QA处理方法中,在操作1001中,图2的处理器120(例如,问题处理模块121)可以确定是否收集语音。如果语音未被收集,则处理器120可维持先前的操作。在维持睡眠状态的同时,处理器120可以仅将图2的音频设备110维持在空闲状态。
如果语音被收集,则在操作1003中,处理器120可以收集语境信息。如果接收到用户语音信号,则处理器120可以使用图1的传感器180(例如,图像传感器、位置信息传感器等)获得用户相关图像或者可以收集用户相关信息。
在操作1005中,处理器120可以基于语境信息来分析语音信息。就这一点而言,处理器120可以将接收到的用户语音信号转换成文本。处理器120可以基于转换的文本配置问题。
在操作1007中,处理器120可以基于分析信息的结果来选择简短答案或描述性答案中的一个。例如,处理器120可以在图1的问题数据库131和答案数据库133或服务器中搜索对于问题的答案,并且可以响应于语境信息来选择简短答案或描述性答案中的至少一个。例如,如果收集关于特定的号码的公共汽车的位置的问题并且如果图1的电子设备100的用户位于他或她的客厅中,则处理器120可以与公共汽车管理服务器通信以获得对于相应的号码的公共汽车到达公共汽车站的时间的简短答案。如果用户当前位于他或她的更衣室中,则处理器120可以与公交管理服务器通信以获得对于相应的号码的公共汽车将到达指定的公共汽车站的时间的多个答案。而且,处理器120可以获得对于每个公共汽车的座位被占用的状态的答案。在操作1009中,处理器120可以基于选择的答案的类型以指定的方式输出相应的答案。
图10b是示出根据示例实施例的QA处理方法的另一示例的流程图。
参照图10b,在操作1051中,图2的处理器120(例如,问题处理模块121)可以获得与图1的电子设备100的用户相对应的语音信号。例如,处理器120可以使用电子设备100的麦克风收集用户的语音信号(或用户命令),或者可以经由电子设备100的通信接口170从外部设备(例如,外部电子设备200)接收语音信号或文本。
在操作1053中,与获得语音信号相关地,处理器120(例如,问题处理模块121)可以获得与用户相关联的语境信息。例如,处理器120可以分析所获得的用户语音信号或文本,并且可以从语音信号中提取问题。处理器120可以分析问题的属性信息并且可以从存储器130获得与属性信息相关联的用户信息。处理器120可以获得与问题的属性信息相关联的语境信息(例如,图像信息)。
在操作1055中,处理器120(例如,问题处理模块121)可以确定语境信息是否满足第一指定条件或第二指定条件。例如,第一指定条件可以包括其中问题的响应长度在某一长度内的条件。第一指定条件可以包括其中询问的用户是第一指定用户的条件。第一指定条件可以包括其中询问的位置是第一指定位置的条件。第一指定条件可以包括其中在问题或对于问题的答案中不包括特殊字母或图像的第一条件。第一指定条件可以包括其中询问的用户采取第一指定条件的手势或姿势的条件。第二指定条件可以包括其中问题的响应长度大于或等于某一长度的条件。第二指定条件其中询问的用户是第二指定条件。第二指定条件可以包括其中询问的位置是第二指定位置的条件。第二指定条件可以包括其中在问题或对于问题的答案中包括特殊字母或图像的第二条件。第二指定条件可以包括其中询问的用户采取第二指定条件的手势或姿势的条件。
如果语境信息满足第一指定条件,则在操作1057中,处理器120(例如,图1的输出模块125)可以输出对应于命令信号的至少部分信息。根据各种实施例,图2的处理器120(例如,附加信息生成模块123)可以基于第一指定条件获得答案,并且可以基于第一条件生成附加信息,该附加信息和与第一指定条件相关联的问题或答案相关联。处理器120可以根据第一条件输出对于问题的答案或附加信息的至少一部分。
如果语境信息满足第二指定条件,则在操作1059中,处理器120(例如,输出模块125)可以输出对应于语音信号的第二答案信息的至少一部分。根据各种实施例,处理器120(例如,附加信息生成模块123)可以基于第二指定条件获得答案,并且可以根据第二条件生成附加信息,该附加信息和与第二指定条件相关联的问题或答案相关联。处理器120可以根据第二条件输出对于问题的答案或附加信息的至少一部分。处理器120(例如,输出模块125)可以以不同的方式输出基于第一指定条件和第二指定条件输出的外部电子设备的类型或外部电子设备的数量中的至少一个。
在图3至10b中示出的过程或方法中描述的操作(例如,操作301至313、操作401至405、操作501至505、操作601至619、操作701至707、操作801至807、操作901至905或操作1001至1009)可以通过连续方法、并行方法、重复方法或启发式方法来运行。例如,可以以不同的顺序运行操作,可以从操作中省略一些操作,或者可以将其他操作添加到操作。
根据各种示例实施例,QA处理方法可以包括:获得与用户相对应的语音信号,与获得语音信号相关地获得与用户相关联的语境信息,确定语境信息是否满足第一指定条件或第二指定条件,并且如果语境信息满足第一指定条件,则输出与语音信号相对应的第一答案信息的至少一部分,并且如果语境信息满足第二指定条件,则输出与语音信号相对应的第二响应信息的至少一部分。
根据各种示例实施例,获得语音信号可以包括使用电子设备的麦克风从用户接收语音信号。
根据各种示例实施例,获得语音信号的至少一部分可以包括使用电子设备的通信接口从外部电子设备接收语音信号。
根据各种示例实施例,QA处理方法可以进一步包括获得与用户相对应的图像。获得语境信息可以包括进一步基于图像获得语境信息。
根据各种示例实施例,QA处理方法可以进一步包括:获得关于答案的属性信息并且如果属性信息满足指定的条件,则使用与用于提供答案信息的指定的方法不同的方法来提供答案信息。
根据各种示例实施例,指定的方法可以包括通过声音提供答案信息。提供答案信息可以包括如果属性信息满足指定的条件,则将答案信息提供为图像或文本。
根据各种示例实施例,属性信息可以包括答案信息的文本长度、指示是否包括特殊字母的信息、类别或其组合。QA处理方法可以进一步包括基于属性信息的至少一部分生成与指定条件相对应的信息。
根据各种示例实施例,输出可以包括:在指定的设备的屏幕上输出附加信息中未被转换为语音信号的信息,或者在指定的设备的屏幕上输出与存储附加信息的存储位置相对应的地址信息。
根据各种示例实施例,上述QA处理方法可以包括与生成附加信息相关地与外围电子设备的存储器(或存储设备)共享数据库,并基于共享的数据库生成附加信息,通过询问的用户的声音和面部识别来标识讲话者并区别地为每个标识的讲话者提供答案,并且存储和管理答案历史并基于存储和管理的答案历史生成附加信息。
根据各种示例实施例,上述QA处理方法可以被配置为与生成附加信息相关地来生成关于每个阶段输出的答案的附加信息,并且基于被监测的用户的用户信息(例如,身体状况、年龄、家庭成员中的位置、爱好、偏好等),生成附加信息以改变提供的附加信息的形式。例如,QA处理方法可以包括如果生成与歌唱讲座、块组装等相关联的附加信息,则基于用户信息改变每个阶段的描述的细节图。QA处理方法可以包括以不同方式对用户信息应用在以指定语境信息应当获得之后进入后续阶段的时间序列答案中进入后续阶段的设置条件(例如,提供更简单的设置条件给相对更年轻或更不熟练的用户,并向相对更老或更熟练的用户提供更困难的设置条件)。
根据各种示例实施例,QA处理方法可以包括改变外部电子设备的类型和外部电子设备的数量以发送针对询问的每个用户的答案或附加信息。
根据各种示例实施例,本公开可以提供一种问题和答案(QA)处理方法,该方法可以包括:在电子设备中获得用户的语音信号,将获得的语音信号转换成文本,基于存储在与电子设备可操作地连接的存储器中的数据搜索对应于的转换后的文本的问题或与该问题相对应的答案,获得找到的问题或答案的属性信息,基于答案和属性信息生成附加信息,并且输出答案或附加信息中的至少一个。
根据各种示例实施例,输出可以包括以下中的至少一个:使用与电子设备可操作地连接的图像传感器获得图像,以及如果分析获得的图像的结果满足条件,输出答案或附加信息中的至少一个。
根据各种示例实施例,输出可以包括:在设备的屏幕上输出附加信息中没有被转换为语音信号的信息,并在设备的屏幕上输出与存储附加信息的存储位置相对应的地址信息。
根据各种示例实施例,输出可以包括:使用与电子设备可操作地连接的图像传感器获得图像,以及将附加信息转换为语音信号并且如果分析获得的图像的结果满足条件,则输出转换的语音信号。
根据各种示例实施例,输出可以包括以下中的至少一个:输出答案的至少一部分并且在满足条件之前等待输出答案的下一部分,以及如果满足条件则输出输出答案的下一部分。
根据各种示例实施例,该方法还可以包括:如果在满足条件之前接收到其他答案,则输出对另一个问题的答案。
图11是示出根据示例实施例的电子设备的示例形式的图。
参照图11,电子设备1101可以是机器人形式的电子设备。电子设备1101可以包括,例如,正面部分1110,传感器单元1120、150和1180,存储单元1130,电力单元1140,显示单元1160,通信单元(例如,包括通信电路)1170和驱动单元(例如,包括驱动电路)1190。
此外,电子设备1101可以被分类为独立类型和安装智能电话或平板个人计算机的扩充口类型。此外,电子设备1101可以基于其是否具有可移动性而被分类为固定类型和移动类型。移动类型可以被划分为具有至少一个车轮并且基于车轮的旋转而移动的车轮类型,包括至少一个轨道并且基于轨道的旋转沿着某一方向移动的履带类型,包括至少一个腿并且通过腿移动沿着某一方向执行旋转、跑步、跳跃等的腿移动类型(例如,2脚型或4脚型),和包括至少一个螺旋桨并基于上升(lift)浮动的飞行类型。
电子设备1101可以具有至少一个驱动单元1190。驱动单元1190可以包括各种电路和可以用于移动电子设备1101并且机械地改变电子设备1101的另一个组件的机械硬件。驱动单元1190的形式可以是在至少一个轴上的上/下或左/右可移动形式,并且可以以各种方式实现。
控制器(未示出)(例如,图1的处理器120)可以包括以下中的至少一个或多个:应用处理器(application processor,AP)、通信处理器(communication processor,CP)、图形处理器(graphic processor,GP)、多芯片封装(multi-chip package,MCP)、图像处理器(image processor,IP)等,其中的每一个执行用于驱动电子设备1101并提供服务的处理。正面部分1110可以是指示执行与电子设备1101的用户的交互的方向的部分,并且可以包括传感器单元1120、1150和1180,传感器单元1120、1150和1180包括用于执行图像感测的至少一个传感器、用于获得语音的至少一个麦克风、机械眼结构以及用于输出屏幕的显示单元1160。正面部分1110可以通过光或以区分方向的形式的短暂机械改变来显示信息。当执行与用户的交互时,正面部分1110可以包括取向于用户的至少一个硬件(H/W)或机械结构。
图12是示出根据示例实施例的电子设备的示例硬件组件的框图。
电子设备1201可以包括参照图1至11描述的电子设备的全部或一些组件。电子设备1201可以包括一个或多个处理器1210(例如,应用处理器(AP))、通信模块(例如,包括通信电路)1220、订户身份模块(subscriber identity module,SIM)1229、存储器1230、传感器模块1240、输入设备(例如,包括输入电路)1250、显示器1260、接口(例如,包括接口电路)1270、音频模块1280、活动模块1290、图像识别模块1299、电力管理模块1295、电池1296、指示器1297和电机1298。
处理器1210可以驱动,例如,操作系统(OS)或应用程序以控制与其连接的多个硬件或软件组件,并且可以处理和计算各种数据。处理器1210可以用例如片上系统(systemon chip,SoC)来实现。根据实施例,处理器1210可以包括图形处理单元(graphicprocessing unit,GPU)(未示出)和/或图像信号处理器(未示出)。处理器1210可以包括图12中所示的组件中的至少一些(例如,蜂窝模块1221)。处理器1210可以将从其他组件(例如,非易失性存储器)中的至少一个接收的命令或数据加载到易失性存储器中以处理该数据并且可以将各种数据存储在非易失性存储器中。
通信模块1220可以具有与图1的通信接口1370相同或相似的配置。通信模块1220可以包括各种通信电路,诸如,例如但不限于,蜂窝模块1221、无线保真(Wi-Fi)模块1222、蓝牙(BT)模块1223、全球导航卫星系统(GNSS)模块1224(例如,GPS模块、Glonass模块、北斗模块或伽利略模块)、近场通信(NFC)模块1225、MST模块1226和射频(RF)模块1227。
蜂窝模块1221可以通过通信网络提供,例如,语音通话服务、视频通话服务、文本消息服务或因特网服务等。根据示例实施例,蜂窝模块1221可以使用SIM 1229(例如,SIM卡)识别并认证通信网络中的电子设备1201。根据示例实施例,蜂窝模块1221可以执行可以由处理器1210提供的至少一部分功能。根据示例实施例,蜂窝模块1221可以包括通信处理器(CP)。
Wi-Fi模块1222、BT模块1223、GNSS模块1224、NFC模块1225或MST模块1226可以包括例如用于处理通过相应模块发送和接收的数据的处理器。根据各种示例实施例,蜂窝模块1221、Wi-Fi模块1222、BT模块1223、GNSS模块1224、NFC模块1225或MST模块1226中的至少一些(例如,两个或多个)可以被包括在一个集成芯片(IC)或一个IC封装中。
RF模块1227可以发送和接收例如通信信号(例如,RF信号)。尽管未示出,但是RF模块1227可以包括,例如,收发器、功率放大器模块(power amplifier module,PAM)、频率滤波器或低噪声放大器(low noise amplifier,LNA)或天线等。根据另一个实施例,蜂窝模块1221、Wi-Fi模块1222、BT模块1223、GNSS模块1224、NFC模块1225或MST模块1226中的至少一个可以通过独立的RF模块发送和接收RF信号。
SIM 1229可以包括,例如,包括SIM和/或嵌入式SIM的卡。SIM 1229可以包括唯一标识信息(例如,集成电路卡标识符(ntegrated circuit card identifier,ICCID))或订户信息(例如,国际移动订户身份(international mobile subscriber identity,IMSI))。
存储器1230(例如,图1的存储器130)可以,包括,例如嵌入式存储器1232或外部存储器1234。嵌入式存储器1232可以包括以下中的至少一个,例如,易失性存储器(例如,动态随机存取存储器(dynamic random access memory,DRAM)、静态RAM(static RAM,SRAM)、同步动态RAM(synchronous dynamic RAM,SDRAM)等),或者非易失性存储器(例如,一次性可编程只读存储器(one-time programmable read only memory,OTPROM)、可编程ROM(programmable ROM,PROM)、可擦除可编程ROM(erasable and programmable ROM,EPROM)、电可擦除可编程ROM(electrically erasable and programmable ROM,EEPROM)、掩模ROM、闪存ROM、闪存(例如,NAND闪存或NOR闪存等),硬盘驱动器或固态驱动器(solid statedrive,SSD))。
外部存储器1234可以包括闪存驱动器,例如,紧凑型闪存(compact flash,CF)、安全数字(secure digital,SD)、微型SD、迷你SD、极限数字(extreme digital,xD)、多媒体卡(multimedia card,MMC)、或记忆棒等。外部存储器1234可以通过各种接口可操作地和/或物理地与电子设备1201连接。
传感器模块1240可以测量例如物理量或者可以检测电子设备1201的操作状态,并且可以将测量或检测到的信息转换为电信号。传感器模块1240可以包括以下各项中的至少一个,例如,手势传感器1240A、陀螺仪传感器1240B、气压计(例如,大气压力)传感器1240C、磁性传感器1240D、加速度传感器1240E、抓握传感器1240F、接近传感器1240G、颜色传感器1240H(例如,红色、绿色、蓝色(RGB)传感器)、生物传感器1240I、温度/湿度传感器1240J、照度传感器1240K、紫外(UV)传感器1240M或θ轴传感器1240P。附加地或可替代地,传感器模块1240可以进一步包括,例如,电子鼻传感器(未示出)、肌电图(electromyography,EMG)传感器(未示出)、脑电图(electroencephalogram,EEG)传感器(未示出)、心电图(electrocardiogram,ECG)传感器(未示出)、红外(infrared,IR)传感器(未示出)、虹膜传感器(未示出)和/或指纹传感器(未示出)等。传感器模块1240可以进一步包括用于控制其中包括的至少一个或多个传感器的控制电路。根据各种实施例,电子设备1201可以进一步包括被配置为控制传感器模块1240的处理器,作为处理器1210的一部分或独立于处理器1210。当处理器1210处于睡眠状态时,电子设备1201可以控制传感器模块1240。
输入设备1250(例如,接口)可以包括各种输入电路,诸如,例如但不限于,触摸面板1252、(数字)笔传感器1254、按键1256或超声输入设备1258。触摸面板1252可以使用,例如,电容型、电阻型、红外型或超声波型中的至少一种。而且,触摸面板1252还可以包括控制电路。触摸面板1252可以进一步包括触觉层并且可以向用户提供触觉反应。
(数字)笔传感器1254可以是,例如,触摸面板1252的一部分,或者可以包括用于识别的单独片。按键1256可以包括,例如,物理按钮、光学按键或小键盘。超声输入设备1258可以允许电子设备1201使用麦克风(例如,麦克风1288)来检测声波并且通过生成超声信号的输入工具来获得数据。
显示器1260(例如,图1的显示器160)可以包括面板1262、全息设备1264、投影仪1266或LED指示器1267。面板1262可以包括与显示器160相同或相似的配置。面板1262可以被实现为,例如,柔性的、透明的或可穿戴的。面板1262和触摸面板1252可以被集成到一个模块中。全息设备1264可以使用光的干涉在空间中显示立体图像。投影仪1266可以将光投影到屏幕上以显示图像。屏幕可以位于例如电子设备1201内部或外部。根据实施例,显示器1260可以进一步包括用于控制面板1262、全息设备1264或投影仪1266的控制电路。
接口1270可以包括各种接口电路,诸如,例如但不限于,高清多媒体接口(high-definition multimedia interface,HDMI)1272、通用串行总线(USB)1274、光接口1276或D超小型1278。接口1270可以被包括在例如图1中所示的通信接口170中。附加地或可选地,接口1270可以包括,例如,移动高清链接(mobile high definition link,MHL)接口、SD卡/多媒体卡(multimedia card,MMC)接口或红外数据协会(infrared data association,IrDA)标准接口。
音频模块1280可以在双向上转换声音和电信号。音频模块1280的组件的至少一部分可以被包括在例如图1所示的输入和输出接口150(或用户接口)中。音频模块1280可以处理通过例如扬声器1282、接收器1284、耳机1286或麦克风1288等输入或输出的声音信息。
活动模块1290可以包括面部表情电机1291、身体姿势电机1292和运动电机1293。面部表情电机1291可以旋转机器人的正面部分。身体姿势电机1292可以旋转机器人的手臂或者可以提供机器人的姿势。运动电机1293可以提供机器人在某方向上的移动。
图像识别模块1299可以是捕获静止图像和运动图像的设备。根据示例实施例,图像识别模块1299可以包括一个或多个图像传感器(未示出)(例如,前传感器或后传感器)、镜头(未示出)、图像信号处理器(ISP)(未示出)、或闪光灯(未示出)(例如,LED或氙灯)。图像识别模块1299可以包括2D相机1299a和深度相机1299b。
电力管理模块1295可以管理例如电子设备1201的电力。根据实施例,尽管未示出,电力管理模块1295可以包括电源管理集成电路(power management integrated circuit,PMIC)、充电器IC或电池量表或油量表。PMIC可以具有有线充电方法和/或无线充电方法。无线充电方法可以包括例如磁共振方法、磁感应方法或电磁方法等。可以进一步提供用于无线充电的附加电路,例如线圈环路、谐振电路或整流器等。当电池1296充电时,电池量表可以测量例如电池1296的剩余容量以及其电压、电流或温度。电池1296可以包括例如可充电电池或太阳能电池。
指示器1297可以显示电子设备1201或其一部分(例如,处理器1210)的特定状态,例如,开机状态、消息状态或充电状态等。电机1298可以将电信号转换成机械振动并且可以产生振动或触觉效果等。虽然未示出,但电子设备1201可以包括用于支持移动TV的处理单元(例如,GPU)。用于支持移动TV的处理单元可以根据标准(例如,数字多媒体广播(digitalmultimedia broadcasting,DMB)标准、数字视频广播(digital video broadcasting,DVB)标准或mediaFloTM标准等)来处理媒体数据。
根据本公开的各种示例实施例的电子设备的每个上述元件可以被配置有一个或多个组件,并且相应元件的名称可以根据电子设备的类型而改变。根据本公开的各种实施例的电子设备可以包括至少一个上述元件,一些元件可以从电子设备中省略,或者其他附加元件可以进一步包括在电子设备中。而且,根据本公开的各种实施例的电子设备的一些元件可以彼此组合以形成一个实体,从而使得可以以与组合之前相同的方式执行相应元件的功能。
图13是示出根据示例实施例的电子设备的示例软件组件的框图。
参照图13,电子设备1301的操作系统(OS)系统软件(S/W)块1310可以扮演作为分配资源和处理作业调度过程的一般OS的角色,并且可以同时在控制各种H/W设备(例如,相机1392和1393、传感器1394和1395、麦克风1396等)以及处理从硬件设备输入的信号中起作用。中间件块1321可以在以下中起作用:使用经处理的数据检测和跟踪电子设备1301的用户的面部位置,通过面部识别执行认证,识别用户的三维(3D)手势,为音频信号执行直接的到达(direct of arrival,DOA),执行语音识别以及处理各种传感器的数据。中间件块1321可以包括手势识别块1321、面部检测/跟踪/识别块1322、传感器信息处理块1323、对话引擎块1324、语音合成块1325、声源跟踪块1326、语音识别块1327等,但不限于此。
智能框架1330可以包括多模式融合块1331、用户模式学习块1333和行为控制器1335。多模式融合块1331可以在收集和管理由中间件块1321处理的各种信息中起作用。用户模式学习块1333可以在使用多模式融合块1331的信息提取和学习诸如用户的生活模式和偏好的有意义的信息中起作用。行为控制块1335可以在呈现作为电子设备1301的移动、图形(例如,用户界面(user interface,UI)和用户体验(user experience,UX))、照明、语音响应、音频等的要由电子设备1310反馈给用户的信息中起作用。就这一点而言,智能框架1330可以与电机1337、显示器1336和扬声器1338连接。智能框架1330还可以包括用于存储针对每个用户学习的信息的用户模型数据库1341、用于控制电子设备1301的行为的行为模型数据库1342以及用于存储其他信息的存储1343。相应的数据库可以被存储并通过网络(云)1309共享。网络1309可以与移动设备1391连接。
图14是示出根据各种示例实施例的程序模块的示例配置的框图。
参照图14,根据实施例,程序模块1414(例如,程序)可以包括控制与上述电子设备相关联的资源的OS和/或在OS上执行的各种应用(例如,应用程序)。OS可以是,例如,Android、iOS、Windows、Symbian、Tizen、Bada等。
程序模块1410可以包括内核1420、中间件1430、应用编程接口(applicationprogramming interface,API)1460和/或应用1470。程序模块1410的至少一部分可以预先加载在电子设备上,或者可以从外部电子设备(例如,图1的外部电子设备200等)下载。
内核1420可以包括例如系统资源管理器1421和/或设备驱动器1423。系统资源管理器1421可以对系统资源进行控制、分配或收集等。根据实施例,系统资源管理器1421可以包括进程管理单元、存储器管理单元或文件系统管理单元等。设备驱动器1423可以包括例如显示驱动器、相机驱动器、蓝牙(BT)驱动器、共享存储器驱动器、通用串行总线(USB)驱动器、小键盘驱动器、无线保真(Wi-Fi)驱动器、音频驱动器或进程间通信(inter-processcommunication,IPC)驱动器。
中间件1430可以提供,例如,应用1470共同需要的功能,并且可以通过API 1460向应用1470提供各种功能使得应用1470有效地使用电子设备中的有限系统资源。根据示例实施例,中间件1430(例如,中间件)可以包括以下中的至少一个:运行时库1435、应用管理器1441、窗口管理器1442、多媒体管理器1443、资源管理器1444、电力管理器1445、数据库管理器1446、包管理器1447、连接性管理器1448、通知管理器1449、位置管理器1450、图形管理器1451、安全管理器1452或支付管理器1454。
运行时库1435可以包括例如由编译器使用的库模块,以在应用1470被运行时通过编程语言添加新的功能。运行时库1435可以执行关于输入和输出管理、存储器管理或算术功能的功能。
应用管理器1441可以管理例如应用1470中的至少一个的生命周期。窗口管理器1442可以管理在电子设备的屏幕上使用的图形用户界面(graphic user interface,GUI)资源。多媒体管理器1443可以确定用于再现各种媒体文件的格式,并且可以使用对应于相应格式的编解码器对媒体文件进行编码或解码。资源管理器1444可以管理应用1470中的至少一个的源代码,并且可以管理存储器或存储空间的资源等。
电力管理器1445可以与例如基本输入/输出系统(basic input/output system,BIOS)等一起工作,可以管理电池或电源,并且可以提供用于电子设备的操作的电力信息。数据库管理器1446可以生成、搜索或改变要在应用1470中的至少一个中使用的数据库。包管理器1447可以管理由一种类型的包文件分发的应用程序的安装或更新。
连接性管理器1448可以管理,例如,诸如Wi-Fi连接或BT连接的无线连接等。通知管理器1449可以通过对用户不干扰的方法来显示或通知诸如到达消息、约会和接近通知的事件。位置管理器1450可以管理电子设备的位置信息。图形管理器1451可以管理要提供给用户的图形效果或与图形效果相关的用户界面(UI)。安全管理器1452可以提供用于系统安全或用户认证等的所有安全功能。根据实施例,当电子设备(例如,图1或1的电子设备100或101)具有电话功能时,中间件1430可以进一步包括用于管理电子设备的语音或视频通信功能的电话管理器(未示出)。
中间件1430可以包括配置上述组件的各种功能的组合的中间件模块。中间件1430可以提供根据OS的种类专门化以提供区分功能的模块。而且,中间件1430可以动态地删除一些旧的组件或者可以添加新的组件。
API 1460可以是例如API编程功能的集合,并且可以根据OS提供有不同的组件。例如,在Android或iOS的情况下,可以根据平台提供一个API集。在Tizen的情况下,可以根据平台提供两个或更多API集。
应用1470可以包括以下中的一个或多个:例如,家庭应用1471、拨号器应用1472、短消息服务/多媒体消息服务(SMS/MMS)应用1473、即时消息(IM)应用1474、浏览器应用1475、相机应用1476、警报应用1477、联系人应用1478、语音拨号应用1479、电子邮件应用1480、日历应用1481、媒体播放器应用1482、相册应用1483、时钟应用1484、支付应用1485、健康护理应用(例如,用于测量运动量或血糖量的应用等)(未示出)或环境信息应用(例如,用于提供大气压力信息、湿度信息或温度信息等的应用)(未示出)等。
根据示例实施例,应用1470可以包括用于在电子设备(例如,图1的电子设备100)和外部电子设备(例如,外部电子设备200)之间交换信息的应用(在下文中,为了更好的理解和易于描述,被称为“信息交换应用”)。信息交换应用可以包括,例如,用于向外部电子设备发送特定信息的通知中继应用或用于管理外部电子设备的设备管理应用。
例如,通知中继应用可以包括发送由电子设备的其他应用(例如,SMS/MMS应用、电子邮件应用、健康护理应用或环境信息应用等)生成的通知信息到外部电子设备(例如,外部电子设备200)的功能。此外,通知中继应用可以从外部电子设备接收,例如,通知信息,并且可以将接收到的通知信息提供给用户。
根据实施例,应用1470可以包括用于在电子设备与外部电子设备之间交换信息的应用(在下文中,为了更好的理解和易于描述,被称为“信息交换应用”)。信息交换应用可以包括,例如,用于向外部电子设备发送特定信息的通知中继应用或用于管理外部电子设备的设备管理应用。
设备管理应用可以管理(例如,安装、删除或更新),例如,与电子设备通信的外部电子设备(例如,外部电子设备200)的功能(例如,打开/关闭外部电子设备本身(或部分组件)的功能或调整显示器的亮度(或分辨率)的功能)、在外部电子设备中操作的应用、或者从外部电子设备提供的服务(例如,呼叫服务或者消息服务)中的至少一个。
根据实施例,应用1470可以包括根据外部电子设备(例如,外部电子设备200)的属性预设的应用(例如,移动医疗设备的健康卡应用)。根据实施例,应用1470可以包括从外部电子设备(例如,服务器、外部电子设备200)接收的应用。根据实施例,应用1470可以包括预先加载的应用或可以从服务器下载的第三方应用。根据本公开的各种实施例的程序模块1410的组件的名称可以根据OS的种类而不同。
根据各种实施例,程序模块1410的至少一部分可以用软件、固件、硬件(例如电路)或其至少两种或更多种组合来实现。程序模块1410的至少一部分可以由例如处理器(例如,图1的处理器120)来实现(例如,运行)。程序模块1410的至少一部分可以包括例如用于执行一个或多个功能的模块、程序、例程、指令集或过程等。
图15是示出根据示例实施例的电子设备的示例语音识别和输出的图。
参考图15,电子设备1500可以从发送者1501接收消息1502。电子设备1500可以用语音提供关于消息1502的查询1503并且可以执行声学语音识别(acoustic speechrecognition,ASR)1504。可替换地,电子设备1500可以提供关于消息1502的元数据的查询1503并且可以执行信息分析1507。例如,电子设备1500可以使用经由感测模块1508通过执行信息分析1507收集的信息来确定接收者1550。电子设备1500可以将关于接收者1550的信息用于个人选择1506。
作为执行ASR 1504的结果,电子设备1500可以获得文本,并且可以提供文本作为查询以执行自然语言理解/对话管理(natural language understanding/dialogmanagement,NLU/DM)1505。这里,电子设备1500可以通过NLU/DM 1505将文本识别为句子。电子设备1500可以使用通过NLU/DM 1505获得的意图、参数和内容中的至少一个用于个人选择1506。电子设备1500可以使用消息1502自身的查询1503作为个人选择1506。
电子设备1500可以基于选择的属性经由自然语言生成器(natural languagegenerator,NLG)1509选择至少一个语言模型1520中的一个。例如,电子设备1500可以确定至少一个文本生成变量。
电子设备1500可以基于所选择的属性来选择至少一个活动模型1530中的一个。例如,电子设备1500可以至少一个活动变量。
电子设备1500可以基于所选择的属性来选择至少一个声学模型1540中的一个。例如,电子设备1500可以确定至少一个语音生成变量,以输出经由NLG 1509转换为文本的消息。电子设备1500可以基于所选择的声学模型输出声音响应。电子设备1500可以执行声音合成1510(例如,TTS)以输出声音响应。
如上所述,电子设备1500可以基于要传输的一个或多个实体或内容之间的关系来改变NLG 1509和TTS模块上的因子,并且可以向执行交互的用户提供动态结果。
在个人选择1506的过程中,电子设备1500可以使用用于视觉、语音等的传感器、连接性、个人简档数据等来识别至少一个用户和环境以及要发送的消息的内容。在语言模式1520的情况下,可以基于接收者1550和电子设备1500来确定另一种语言模型。例如,如果通过先前的设置或学习将接收者1550和电子设备1500之间的关系设置为朋友,则可以选择用于构成指示友好性的词语和句子的语言模型。基于应该发送给电子设备1500的用户以执行语言转换的消息,可以为紧急消息选择具有快速清晰音调特性的声学模型。在另一个实施例中,电子设备1500可以基于其中接收者1550在听取高频带的语音方面弱的信息,将高频带的语音的声学模型调制为低频带的语音的声学模型。
上述机器人电子设备可以执行确定通过分析接收到的语音问题的过程的进展中的QA结果是简短答案还是顺序答案的过程。如果确定QA结果不是简短答案,则机器人电子设备可以确定对于QA结果的合适答案方案。例如,机器人电子设备可以使用WIKI URL/相关URL通过无线保真(Wi-Fi)、蓝牙(BT)、声音QR,将QR码发送到便携式设备,或者可以以正在被输出的形式发送屏幕。可替换地,机器人电子设备可将JavaScript对象符号(JSON)类型答案转换成可被输出的形式的文件(例如,DOC文件、JPG文件、PDF文件等)并且可以将文件发送到便携式设备。
根据各种示例实施例,在程序的计算机可读存储介质中,至少一个指令可以被存储在计算机可读存储介质中。当由处理器执行时,所述至少一个指令可以被配置为:获得与用户相对应的语音信号,与获取语音信号相关地获得与用户相关联的语境信息,确定语境信息是否满足第一指定条件或第二指定条件,并且如果语境信息满足所述第一指定条件,则输出与语音信号相对应的第一答案信息的至少一部分,并且如果语境信息满足第二指定条件,则输出与语音信号相对应的第二答案信息的至少一部分。
根据各种示例实施例,在程序的计算机可读存储介质中,至少一个指令可以被存储在计算机可读存储介质中。当由处理器执行时,该至少一个指令可以被配置为:收集用户语音信号,将收集的语音信号转换为文本,基于存储在电子设备的存储器中的数据搜索与转换的文本对应的答案或与问题对应的答案,收集找到的问题或答案的属性信息,基于答案和属性信息生成附加信息,并输出答案或附加信息中的至少一个。
根据各种示例实施例,电子设备可以输出适合于用户问题的各种形式的答案。
这里使用的术语“模块”可以指代,例如,包括硬件(例如电路)、软件和固件或者其两种或更多种组合中之一的单元。术语“模块”可以与,例如,术语“单元”、“逻辑”、“逻辑块”、“组件”或“电路”等可互换地使用。“模块”可以是集成组件的最小单元或其部分。“模块”可以是执行一个或多个功能的最小单元或其部分。“模块”可以被机械地或电子地实现。例如,“模块”可以包括处理电路、专用集成电路(ASIC)芯片、现场可编程门阵列(FPGA)或可编程逻辑器件中的至少一种,其是众所周知的或将是在未来开发的用于执行某些操作。
根据本公开的各种示例实施例,可以利用例如存储在具有程序模块的计算机可读存储介质中的指令来实现设备(例如,模块或功能)或方法(例如,操作)的至少一部分。当指令由处理器执行时,一个或多个处理器可以执行对应于指令的功能。计算机可读存储介质可以是例如存储器。
计算机可读存储介质可以包括硬盘、软盘、磁介质(例如,磁带)、光介质(例如,光盘只读存储器(CD-ROM)和数字多功能光盘(DVD))、磁光介质(例如,软光盘)、硬件设备(例如,ROM、随机存取存储器(RAM)或闪存等)等。而且,程序指令不仅可以包括由编译器编译的机器码,还可以包括可以由计算机使用解释器等运行的高级语言代码。上述硬件设备可以被配置为操作为一个或多个软件模块以根据本公开的各种实施例执行操作,反之亦然。
根据本公开的各种示例实施例的模块或程序模块可以包括至少一个或多个上述组件,上述组件中的一些可以被省略,或者可以进一步包括其他附加组件。由模块执行的操作、程序模块或其他组件可以通过连续方法、并行方法、重复方法或启发式方法来执行。而且,一些操作可以以不同的顺序执行或可以省略,并且可以添加其他操作。
将在附图中描述和示出的本公开的实施例作为示例提供,以描述技术内容并及帮助理解,但不是限制本公开。因此,应该理解的是,除了在此列举的示例性实施例之外,基于本公开的技术思想推导的所有修改或修改形式都包括在由权利要求书及其等同物中限定的本公开中。
本公开的上述示例实施例可以以硬件(例如,电路)、固件或经由能够存储在记录介质(诸如CD ROM、数字通用光盘(Digital Versatile Disc,DVD)、磁带、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码的执行、或通过网络下载的最初存储在远程记录介质或非暂时机器可读介质上的并且要被存储在本地记录介质上的计算机代码来实现,使得这里描述的方法可以使用通用计算机或专用处理器或在可编程或专用硬件(诸如,ASIC或FPGA)中经由存储在记录介质上的这种软件来呈现。如本领域中将理解的,计算机、处理器、微处理器控制器或可编程硬件包括存储器组件,例如RAM、ROM、闪存等,其可以存储或接收软件或计算机代码,所述软件或计算机代码当被计算机、处理器或硬件访问和运行时,实现在此描述的处理方法。
控制单元可以包括微处理器或任何合适类型的处理电路,诸如一个或多个通用处理器(例如,基于ARM的处理器)、数字信号处理器(DSP)、可编程逻辑器件(PLD)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、视频卡控制器等。另外,应该认识到,当通用计算机访问用于实现在此所示的处理的代码时,代码的运行将通用计算机转换成专用计算机,以用于执行这里所示的处理。附图中提供的任何功能和步骤可以用硬件、软件或两者的组合来实现,并且可以全部或部分地在计算机的编程指令内执行。
Claims (15)
1.一种电子设备,包括:
通信接口,其包括通信电路;和
处理器,其功能地连接到所述通信接口,
其中所述处理器被配置为:
获得语音信号,
与获得语音信号相关地验证与用户相关联的语境信息;
如果所述语境信息满足第一条件,则确定与所验证的语境信息相对应的第一响应信息;
如果所述语境信息满足第二条件,则确定与所验证的语境信息相对应的第二响应信息;和
将与所述第一响应信息和/或所述第二响应信息相对应的响应信息的至少一部分发送到与所述电子设备可操作地连接的输出设备或所述电子设备的外部电子设备。
2.根据权利要求1所述的电子设备,还包括:
图像传感器,被配置为获得与用户相关联的图像,
其中所述处理器被配置为:
基于图像验证语境信息。
3.根据权利要求1所述的电子设备,其中所述处理器被配置为:
验证属性信息以区分响应信息的种类或类别;和
通过声音提供答案信息,以及
其中所述处理器被配置为:
将答案信息输出为图像、文本或声音中的至少一个。
4.根据权利要求3所述的电子设备,其中,所述属性信息包括所述答案信息的文本长度、指示是否包括特殊字母的信息、类别或其组合,以及
其中所述处理器被配置为:
基于属性信息的至少一部分生成与条件相对应的信息。
5.一种电子设备,包括:
音频设备,包括被配置为获得语音信号的音频电路;
存储器,被配置为存储与所述语音信号相关联的问题和/或答案;和
处理器,被配置为可操作地与音频设备和/或存储器连接,
其中所述处理器被配置为:
将获得的语音信号转换为文本;
基于存储在存储器中的数据搜索与转换的文本相对应的问题或与问题相对应的答案;
获得找到的问题或答案的属性信息;
基于答案和属性信息生成附加信息;和
输出答案或附加信息中的至少一个。
6.根据权利要求5所述的电子设备,还包括:
传感器,被配置为获得图像,
其中所述处理器被配置为:
使用传感器获得外围图像;和
如果分析所获得的外围图像的结果满足条件,则输出答案或附加信息中的至少一个。
7.根据权利要求5所述的电子设备,其中所述处理器被配置为:
将附加信息转换为语音信号并且输出所转换的语音信号,或者
在设备的屏幕上输出未转换为语音信号的附加信息。
8.根据权利要求5所述的电子设备,其中所述处理器被配置为:
在设备的屏幕上输出地址信息,所输出的地址信息与存储附加信息的存储位置相对应。
9.根据权利要求5所述的电子设备,其中所述处理器被配置为:
输出答案的至少一部分;
在条件满足之前等待输出答案的下一部分;
如果条件满足,输出答案的下一部分;和
如果在满足条件之前接收到对另一问题的答案,则输出对另一问题的答案。
10.一种问题和答案QA处理方法,所述方法包括:
在电子设备中获得语音信号;
将获得的语音信号转换成文本;
基于存储在与所述电子设备可操作地连接的存储器中的数据,搜索与所转换的文本相对应的问题和/或与所述问题相对应的答案;
获得找到的问题或答案的属性信息;
基于答案和属性信息生成附加信息;和
输出答案和附加信息中的至少一个。
11.根据权利要求10所述的方法,其中输出答案和附加信息中的至少一个包括:
使用与所述电子设备可操作地连接的图像传感器获得外围图像;和
如果分析所获得的外围图像的结果满足条件,则输出答案或附加信息中的至少一个。
12.根据权利要求11所述的方法,其中,输出答案或附加信息中的至少一个包括:
在设备的屏幕上输出附加信息中未被转换为语音信号的信息;和
在设备的屏幕上输出与存储附加信息的存储位置相对应的地址信息。
13.根据权利要求10所述的方法,其中输出答案和附加信息中的至少一个包括:
使用与所述电子设备可操作地连接的图像传感器获得外围图像;和
如果分析所获得的外围图像的结果满足条件,则将附加信息转换为语音信号并且输出所转换的语音信号。
14.根据权利要求10所述的方法,其中输出答案和附加信息中的至少一个包括:
输出答案的至少一部分并且在满足条件之前等待输出答案的下一部分;和
如果条件满足,则输出所输出答案的下一部分。
15.根据权利要求14所述的方法,还包括:
如果在满足条件之前接收到对另一问题的答案,则输出对另一问题的答案。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2015-0167100 | 2015-11-27 | ||
KR1020150167100A KR102558437B1 (ko) | 2015-11-27 | 2015-11-27 | 질의 응답 처리 방법 및 이를 지원하는 전자 장치 |
PCT/KR2016/013414 WO2017090947A1 (en) | 2015-11-27 | 2016-11-21 | Question and answer processing method and electronic device for supporting the same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108292317A true CN108292317A (zh) | 2018-07-17 |
CN108292317B CN108292317B (zh) | 2022-05-24 |
Family
ID=58763335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680068844.7A Active CN108292317B (zh) | 2015-11-27 | 2016-11-21 | 问题和答案处理方法以及支持该方法的电子设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10446145B2 (zh) |
EP (1) | EP3332338A4 (zh) |
KR (1) | KR102558437B1 (zh) |
CN (1) | CN108292317B (zh) |
WO (1) | WO2017090947A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210237757A1 (en) * | 2020-01-31 | 2021-08-05 | Toyota Jidosha Kabushiki Kaisha | Information processing device, information processing method, and storage medium storing information processing program |
CN114579820A (zh) * | 2022-03-21 | 2022-06-03 | 徐涛 | 在人机对话中提取语境特征的方法及装置 |
CN114580375A (zh) * | 2022-05-09 | 2022-06-03 | 南京赛宁信息技术有限公司 | 一种分布式在线比赛主观题阅卷及评分方法与系统 |
WO2023134385A1 (zh) * | 2022-01-12 | 2023-07-20 | 北京字节跳动网络技术有限公司 | 一种搜索结果展示, 搜索请求处理方法及装置 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017146437A (ja) * | 2016-02-17 | 2017-08-24 | 本田技研工業株式会社 | 音声入力処理装置 |
US10880833B2 (en) * | 2016-04-25 | 2020-12-29 | Sensory, Incorporated | Smart listening modes supporting quasi always-on listening |
US10621992B2 (en) * | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
US10916243B2 (en) * | 2016-12-27 | 2021-02-09 | Amazon Technologies, Inc. | Messaging from a shared device |
KR20180098079A (ko) | 2017-02-24 | 2018-09-03 | 삼성전자주식회사 | 비전 기반의 사물 인식 장치 및 그 제어 방법 |
JP6621776B2 (ja) * | 2017-03-22 | 2019-12-18 | 株式会社東芝 | 検証システム、検証方法及びプログラム |
US10664533B2 (en) | 2017-05-24 | 2020-05-26 | Lenovo (Singapore) Pte. Ltd. | Systems and methods to determine response cue for digital assistant based on context |
CN107666539A (zh) * | 2017-10-12 | 2018-02-06 | 广东小天才科技有限公司 | 一种穿戴设备的信息处理方法及穿戴设备 |
US11360736B1 (en) * | 2017-11-03 | 2022-06-14 | Amazon Technologies, Inc. | System command processing |
KR102561712B1 (ko) * | 2017-12-07 | 2023-08-02 | 삼성전자주식회사 | 음성 인식 장치 및 그 동작 방법 |
CN110415688B (zh) * | 2018-04-26 | 2022-02-08 | 杭州萤石软件有限公司 | 一种信息交互方法及机器人 |
CN108875055B (zh) * | 2018-06-28 | 2021-12-24 | 联想(北京)有限公司 | 一种答案提供方法及设备 |
WO2020022723A1 (ko) * | 2018-07-20 | 2020-01-30 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR102008992B1 (ko) * | 2018-08-08 | 2019-08-08 | 주식회사 커넥트닷 | 챗봇을 이용한 부동산 거래 비서 서비스 장치 및 방법 |
US11532007B2 (en) | 2018-08-16 | 2022-12-20 | Frank S. Maggio | Systems and methods for implementing user-responsive reactive advertising via voice interactive input/output devices |
KR102536057B1 (ko) * | 2018-08-28 | 2023-05-26 | 십일번가 주식회사 | 이미지 검색을 위한 요약 정보 제공 방법 및 이를 지원하는 서비스 장치 |
US11040441B2 (en) * | 2018-09-20 | 2021-06-22 | Sony Group Corporation | Situation-aware robot |
CN110163576A (zh) * | 2019-05-22 | 2019-08-23 | 郑州智通互联电子有限公司 | 一种基于云网络的校园考勤管理系统 |
WO2021133155A1 (en) * | 2019-12-23 | 2021-07-01 | Mimos Berhad | System and method for managing voice query of a presentation |
CN113468176B (zh) * | 2021-06-30 | 2023-09-26 | 北京百度网讯科技有限公司 | 信息录入方法和装置、电子设备、计算机可读存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1723707A (zh) * | 2002-10-11 | 2006-01-18 | 韩国电子通信研究院 | 用于提供电子节目指南的系统和方法 |
CN1734440A (zh) * | 2000-03-16 | 2006-02-15 | 微软公司 | 通知平台总体结构 |
US20100145976A1 (en) * | 2008-12-05 | 2010-06-10 | Yahoo! Inc. | System and method for context based query augmentation |
CN103019389A (zh) * | 2013-01-12 | 2013-04-03 | 福建华映显示科技有限公司 | 手势辨识系统及手势辨识方法 |
US20130185081A1 (en) * | 2010-01-18 | 2013-07-18 | Apple Inc. | Maintaining Context Information Between User Interactions with a Voice Assistant |
CN103279508A (zh) * | 2012-12-31 | 2013-09-04 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
CN103491100A (zh) * | 2013-09-30 | 2014-01-01 | 中国科学院计算技术研究所 | 一种在多方间构建令牌关联关系的系统 |
CN103516711A (zh) * | 2012-06-27 | 2014-01-15 | 三星电子株式会社 | 显示设备、用于控制显示设备的方法和交互系统 |
US20140074466A1 (en) * | 2012-09-10 | 2014-03-13 | Google Inc. | Answering questions using environmental context |
US20140365209A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | System and method for inferring user intent from speech inputs |
JP2015087796A (ja) * | 2013-10-28 | 2015-05-07 | 株式会社Nttドコモ | 質問分野判定装置及び質問分野判定方法 |
US20150134337A1 (en) * | 2013-11-13 | 2015-05-14 | Naver Corporation | Conversation based search system and method |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4162074B2 (ja) * | 2001-09-27 | 2008-10-08 | 三菱電機株式会社 | 対話型情報検索装置 |
JP3944159B2 (ja) * | 2003-12-25 | 2007-07-11 | 株式会社東芝 | 質問応答システムおよびプログラム |
US20070136222A1 (en) * | 2005-12-09 | 2007-06-14 | Microsoft Corporation | Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content |
US7941753B2 (en) * | 2006-03-31 | 2011-05-10 | Aol Inc. | Communicating appointment and/or mapping information among a calendar application and a navigation application |
US8175248B2 (en) * | 2007-01-29 | 2012-05-08 | Nuance Communications, Inc. | Method and an apparatus to disambiguate requests |
KR20090069133A (ko) * | 2007-12-24 | 2009-06-29 | 한국전자통신연구원 | 이동 단말기 및 그 제어방법 |
US20100178956A1 (en) * | 2009-01-14 | 2010-07-15 | Safadi Rami B | Method and apparatus for mobile voice recognition training |
KR20110114797A (ko) * | 2010-04-14 | 2011-10-20 | 한국전자통신연구원 | 음성을 이용한 모바일 검색 장치 및 방법 |
US8401853B2 (en) * | 2010-09-22 | 2013-03-19 | At&T Intellectual Property I, L.P. | System and method for enhancing voice-enabled search based on automated demographic identification |
EP2622428A4 (en) * | 2010-09-28 | 2017-01-04 | International Business Machines Corporation | Providing answers to questions using hypothesis pruning |
US9161166B2 (en) * | 2012-02-24 | 2015-10-13 | Blackberry Limited | Method and apparatus for interconnected devices |
KR20140123369A (ko) | 2013-04-12 | 2014-10-22 | 얄리주식회사 | 음성인식 질의응답 시스템 및 그것의 운용방법 |
US20150162000A1 (en) * | 2013-12-10 | 2015-06-11 | Harman International Industries, Incorporated | Context aware, proactive digital assistant |
US20160012475A1 (en) * | 2014-07-10 | 2016-01-14 | Google Inc. | Methods, systems, and media for presenting advertisements related to displayed content upon detection of user attention |
-
2015
- 2015-11-27 KR KR1020150167100A patent/KR102558437B1/ko active IP Right Grant
-
2016
- 2016-11-21 WO PCT/KR2016/013414 patent/WO2017090947A1/en active Application Filing
- 2016-11-21 CN CN201680068844.7A patent/CN108292317B/zh active Active
- 2016-11-21 EP EP16868843.0A patent/EP3332338A4/en not_active Ceased
- 2016-11-23 US US15/360,050 patent/US10446145B2/en not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1734440A (zh) * | 2000-03-16 | 2006-02-15 | 微软公司 | 通知平台总体结构 |
CN1723707A (zh) * | 2002-10-11 | 2006-01-18 | 韩国电子通信研究院 | 用于提供电子节目指南的系统和方法 |
US20100145976A1 (en) * | 2008-12-05 | 2010-06-10 | Yahoo! Inc. | System and method for context based query augmentation |
US20130185081A1 (en) * | 2010-01-18 | 2013-07-18 | Apple Inc. | Maintaining Context Information Between User Interactions with a Voice Assistant |
CN103516711A (zh) * | 2012-06-27 | 2014-01-15 | 三星电子株式会社 | 显示设备、用于控制显示设备的方法和交互系统 |
US20140074466A1 (en) * | 2012-09-10 | 2014-03-13 | Google Inc. | Answering questions using environmental context |
CN103279508A (zh) * | 2012-12-31 | 2013-09-04 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
CN103019389A (zh) * | 2013-01-12 | 2013-04-03 | 福建华映显示科技有限公司 | 手势辨识系统及手势辨识方法 |
US20140365209A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN103491100A (zh) * | 2013-09-30 | 2014-01-01 | 中国科学院计算技术研究所 | 一种在多方间构建令牌关联关系的系统 |
JP2015087796A (ja) * | 2013-10-28 | 2015-05-07 | 株式会社Nttドコモ | 質問分野判定装置及び質問分野判定方法 |
US20150134337A1 (en) * | 2013-11-13 | 2015-05-14 | Naver Corporation | Conversation based search system and method |
Non-Patent Citations (3)
Title |
---|
FILIPE MARINS等: "Starting to cook a tutoring dialogue system", 《2008 IEEE SPOKEN LANGUAGE TECHNOLOGY WORKSHOP》 * |
ULRICH SCHAFER等: "Ingredients and Recipe for a Robust Mobile Speech-Enabled Cooking Assistant for German", 《KI 2013:ADVANCES IN ARTIFICIAL INTELLIGENCE》 * |
蔡刚山: "中文自动问答系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210237757A1 (en) * | 2020-01-31 | 2021-08-05 | Toyota Jidosha Kabushiki Kaisha | Information processing device, information processing method, and storage medium storing information processing program |
US11577745B2 (en) * | 2020-01-31 | 2023-02-14 | Toyota Jidosha Kabushiki Kaisha | Information processing device, information processing method, and storage medium storing information processing program |
WO2023134385A1 (zh) * | 2022-01-12 | 2023-07-20 | 北京字节跳动网络技术有限公司 | 一种搜索结果展示, 搜索请求处理方法及装置 |
CN114579820A (zh) * | 2022-03-21 | 2022-06-03 | 徐涛 | 在人机对话中提取语境特征的方法及装置 |
CN114580375A (zh) * | 2022-05-09 | 2022-06-03 | 南京赛宁信息技术有限公司 | 一种分布式在线比赛主观题阅卷及评分方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
US10446145B2 (en) | 2019-10-15 |
EP3332338A4 (en) | 2018-08-15 |
US20170154626A1 (en) | 2017-06-01 |
WO2017090947A1 (en) | 2017-06-01 |
KR20170061923A (ko) | 2017-06-07 |
KR102558437B1 (ko) | 2023-07-24 |
CN108292317B (zh) | 2022-05-24 |
EP3332338A1 (en) | 2018-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108292317A (zh) | 问题和答案处理方法以及支持该方法的电子设备 | |
KR102363794B1 (ko) | 정보 제공 방법 및 이를 지원하는 전자 장치 | |
CN107637025B (zh) | 用于输出消息的电子装置及其控制方法 | |
CN110199350A (zh) | 用于感测语音结束的方法和实现该方法的电子设备 | |
CN108121490A (zh) | 用于处理多模式输入的电子装置、方法和服务器 | |
US20160142407A1 (en) | Method and apparatus for displaying user interface in electronic device | |
CN108665890A (zh) | 操作语音识别服务的方法、电子设备和支持该设备的系统 | |
CN108369808A (zh) | 电子设备和用于控制该电子设备的方法 | |
US20170147919A1 (en) | Electronic device and operating method thereof | |
US20160156575A1 (en) | Method and apparatus for providing content | |
CN109272994A (zh) | 话音数据处理方法以及支持该话音数据处理方法的电子装置 | |
CN108023934A (zh) | 电子装置及其控制方法 | |
CN105748057A (zh) | 信息显示方法和支持该信息显示方法的电子设备 | |
CN108885498A (zh) | 电子装置和在电子装置中提供信息的方法 | |
CN108376546A (zh) | 语音输入方法以及用于支持该方法的电子设备和系统 | |
CN108475536A (zh) | 用于提供活动指导信息的方法和支持所述方法的电子装置 | |
KR102423298B1 (ko) | 음성 인식 서비스 운용 방법, 이를 지원하는 전자 장치 및 시스템 | |
CN109102802A (zh) | 用于处理用户话语的系统 | |
KR20170089178A (ko) | 전자 장치, 전자 장치의 음성 인식 방법 | |
CN108288471A (zh) | 用于识别语音的电子设备 | |
CN108351892A (zh) | 用于提供对象推荐的电子装置和方法 | |
KR20170087142A (ko) | 센서 활용 방법 및 이를 구현한 전자 장치 | |
CN110249364A (zh) | 用于提供健康内容的方法和电子设备 | |
CN109196546A (zh) | 电子设备和包括该电子设备的信息处理系统 | |
CN108141490A (zh) | 用于处理图像的电子设备及其控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |