CN111178019A - 基于语音控制的机器人文字书写方法、装置和系统 - Google Patents

基于语音控制的机器人文字书写方法、装置和系统 Download PDF

Info

Publication number
CN111178019A
CN111178019A CN201911422323.9A CN201911422323A CN111178019A CN 111178019 A CN111178019 A CN 111178019A CN 201911422323 A CN201911422323 A CN 201911422323A CN 111178019 A CN111178019 A CN 111178019A
Authority
CN
China
Prior art keywords
information
writing
character
content
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911422323.9A
Other languages
English (en)
Inventor
刘培超
邢淑敏
刘主福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yuejiang Technology Co Ltd
Original Assignee
Shenzhen Yuejiang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yuejiang Technology Co Ltd filed Critical Shenzhen Yuejiang Technology Co Ltd
Priority to CN201911422323.9A priority Critical patent/CN111178019A/zh
Publication of CN111178019A publication Critical patent/CN111178019A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Toys (AREA)

Abstract

本发明实施例提出一种基于语音控制的机器人文字书写方法、装置和系统,涉及机器人技术领域。本发明实施例提供的基于语音控制的机器人文字书写方法、装置和系统,根据获取得到的语音信息确定书写内容信息和书写形式信息,基于书写内容信息和书写形式信息确定书写内容信息中每个文字对应的运笔轨迹信息,根据每个文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,将三维运动轨迹指令信息发送至机器人,以使机器人书写文字,实现了文字书写的个性化和定制化,并且通过人机交互,提高了用户体验。

Description

基于语音控制的机器人文字书写方法、装置和系统
技术领域
本发明涉及机器人技术领域,具体而言,涉及一种基于语音控制的机器人文字书写方法、装置和系统。
背景技术
随着机器人技术的不断发展,机器人已经广泛应用于工业领域的焊接、装配、搬运、喷绘等方面。机器人是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作,例如生产业、建筑业,或是危险的工作。
当前国内机器人技术应用教学还处于一个普及阶段,教学仪器领域中缺乏针对机器人实践教学的专用装置。在生活中经常会遇到一些需要重复书写的场合,如书写邀请函、请贴等,此时打印或复印一般都无法操作,通过手写又费时费力,因此需要一个能自动写字的装置来代替人的书写。
目前,大多数机器人运动轨迹是通过设置文字的轨迹来制定的,但是这种方式只能让机器人沿特定字体的文字轨迹进行绘制,缺少个性化和定制化,并且机器人与人的交互较少,缺乏互动体验。
发明内容
有鉴于此,本发明提供了一种基于语音控制的机器人文字书写方法、装置和系统。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供一种基于语音控制的机器人文字书写方法,包括:
根据语音信息确定书写内容信息和书写形式信息;
根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息;
根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息;
将所述三维运动轨迹指令信息发送至所述机器人。
在可选的实施方式中,所述书写形式信息包含字体信息;所述根据语音信息确定书写内容信息和书写形式信息的步骤,包括:
通过语音特征提取获得所述语音信息中的所述书写内容信息和所述字体信息;
根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息的步骤,包括:
根据所述字体信息,调用字体库中所述书写内容信息中每个文字对应的坐标信息以及运笔信息;所述每个文字对应的坐标信息与所述字体信息匹配,所述每个文字对应的运笔信息包括笔画顺序以及笔画宽度。
在可选的实施方式中,所述书写形式信息包含排版信息;所述根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息的步骤,包括:
根据每个所述文字对应的运笔轨迹信息和所述排版信息,生成控制所述机器人运笔的三维运动轨迹指令信息。
在可选的实施方式中,所述书写机器人还包括视觉模块;在所述根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息的步骤之前,还包括:
根据识别的待书写区域信息确定书写范围信息;
根据所述书写内容信息和所述书写范围信息对每个文字对应的运笔轨迹信息进行缩放,以使所述每个文字对应的运笔轨迹信息与所述书写范围信息匹配。
在可选的实施方式中,所述根据语音信息确定书写内容信息的步骤,包括:
根据所述语音信息获得待匹配文字内容和所述书写形式信息;
根据所述待匹配文字内容在内容库中确定与所述待匹配文字内容对应的关联文字内容;
将所述待匹配文字内容和所述关联文字内容作为所述书写内容信息。
第二方面,本发明实施例提供一种基于语音控制的机器人文字书写装置,所述机器人文字书写装置包括内容确定单元、处理单元以及执行单元;
所述内容确定单元用于根据语音信息确定书写内容信息和书写形式信息;
所述处理单元用于根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息;
所述执行单元用于根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,并将所述三维运动轨迹指令信息发送至所述机器人。
在可选的实施方式中,所述书写形式信息包含字体信息;
所述内容确定单元用于通过语音特征提取获得所述语音信息中的所述书写内容信息和所述字体信息;
所述处理单元用于根据所述字体信息,调用字体库中所述书写内容信息中每个文字对应的坐标信息以及运笔信息;所述每个文字对应的坐标信息与所述字体信息匹配,所述每个文字对应的运笔信息包括笔画顺序以及笔画宽度。
在可选的实施方式中,所述内容确定单元用于根据所述语音信息获得待匹配文字内容和所述书写形式信息,并根据所述待匹配文字内容在内容库中确定与所述待匹配文字内容对应的关联文字内容,将所述待匹配文字内容和所述关联文字内容作为所述书写内容信息。
第三方面,本发明实施例提供一种基于语音控制的机器人文字书写系统,包括话筒、机器人以及处理模块;
所述话筒用于采集语音信息;
所述处理模块用于根据所述语音信息确定书写内容信息和书写形式信息,根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息,根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,并将所述三维运动轨迹指令信息发送至所述机器人。
第四方面,本发明实施例提供一种存储介质,所述存储介质中存储有处理模块程序,所述处理模块程序被执行时实现前述实施方式中任意一项所述的基于语音控制的机器人文字书写方法。
本发明实施例提供的基于语音控制的机器人文字书写方法、装置和系统,根据获取得到的语音信息确定书写内容信息和书写形式信息,基于书写内容信息和书写形式信息确定书写内容信息中每个文字对应的运笔轨迹信息,根据每个文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,将三维运动轨迹指令信息发送至机器人,以使机器人书写文字,实现了文字书写的个性化和定制化,并且通过人机交互,提高了用户体验。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的机器人文字书写系统的一种结构示意图。
图2为本发明实施例所提供的机器人的一种结构示意图。
图3为本发明实施例所提供的处理模块的一种方框示意图。
图4为本发明实施例所提供的基于语音控制的机器人文字书写方法的一种流程示意图。
图5为本发明实施例所提供的基于语音控制的机器人文字书写方法的另一种流程示意图。
图6为本发明实施例所提供的基于语音控制的机器人文字书写方法的又一种流程示意图。
图7为本发明实施例提供的机器人文字书写系统的另一种结构示意图。
图8为本发明实施例所提供的基于语音控制的机器人文字书写方法的又一种流程示意图。
图9为本发明实施例所提供的基于语音控制的机器人文字书写方法的一种子步骤流程示意图。
图10为本发明实施例所提供的基于语音控制的机器人文字书写装置的一种方框示意图。
图标:100-机器人文字书写系统;10-处理模块;11-机器人文字书写装置;111-内容确定单元;112-处理单元;113-执行单元;114-范围确定单元;12-存储器;13-处理器;14-通信单元;20-话筒;30-机器人;31-底座;32-第一机械臂;33-第二机械臂;34-执笔器;40-视觉模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,机器人写字的功能需要通过控制机器臂末端沿指定的轨迹运动而实现,其运动控制可通过离线编程和在线编程两种方式来实现。离线编程在机器人作业之前制定好运动的轨迹,然后作业时按照指定的轨迹运动;在线编程则是在操作人员制定运动轨迹的同时,机器人就沿着当前轨迹绘制。
其中,在线编程方式通过人工手动设置书写的轨迹点,费工费时,且轨迹点的数目很有限,从而导致轨迹比较简单。离线编程方式基于文字的轨迹来制定机器人写字的轨迹,但是这种方式只能让机器人沿特定字体的文字轨迹进行绘制,缺少个性化和定制化,并且机器人与人的交互较少,缺乏互动体验,不适合应用推广。
基于上述研究,本实施例提供了一种基于语音控制的机器人文字书写方法,以改善上述问题。
请参照图1,图1为本实施例所提供的基于语音控制的机器人文字书写系统。本实施例所提供的基于语音控制的机器人文字书写方法可以应用于该机器人文字书写系统100。
如图1所示,机器人文字书写系统100包括处理模块10、话筒20以及机器人30。其中,话筒20和机器人30可分别与处理模块10有线或无线连接,有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。
作为一种实施方式,本实施例所提供的处理模块10、话筒20以及机器人30可以集成为一个设备,又或者,处理模块10可以和话筒20可以集成至同一设备上,也可以以智能设备进行替换,例如智能手机,平板电脑等。
在本实施例中,话筒20用于采集语音信息。处理模块10用于根据语音信息确定书写内容信息和书写形式信息,根据书写内容信息和书写形式信息,确定书写内容信息中每个文字对应的运笔轨迹信息,根据每个文字对应的运笔轨迹信息,生成控制机器人30运笔的三维运动轨迹指令信息,并将三维运动轨迹指令信息发送至机器人30。
其中,话筒20可以为有线话筒或无线话筒,当话筒20为有线话筒时,话筒20可以与处理模块10通过信号线实现电性连接。当话筒20为无线话筒时,话筒20可以与处理模块10无线连接。
作为一种可选的实施方式,请结合参阅图2,机器人30可以包括底座31、第一机械臂32、第二机械臂33以及执笔器34等组件。其中,底座31设置于工作平台,用于支撑机器人30,第一机械臂32与底座31连接,第二机械臂33与第一机械臂32连接,执笔器34与第二机械臂33连接。
可选的,在本实施例中,第一机械臂32的长度为135mm,转动角度为0-85°,第二机械臂33的长度为147mm,转动角度为-10°-+90°,底座31的转动角度为-90°-+90°。因此,本实施例所提供的机器人30具有多个自由度,能够控制执笔器34在沿多个方向上的运动,如图2所示,执笔器34在能够在第二机械臂33的带动下,沿X、Y、Z方向进行移动以及沿Z方向进行转动。
如图2所示,执笔器34用于夹持书写笔,在书写文字时,处理模块10通过控制机械臂的运动,带动执笔器34在书写纸上书写文字。书写笔可以是,但不限于毛笔、铅笔、钢笔或圆珠笔等。
在本实施例中,处理模块10可以是,但不限于,智能手机、个人电脑(personalcomputer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)等具有数据处理能力的设备。
如图3所示,处理模块10包括机器人文字书写装置11、存储器12、处理器13及通信单元14。
存储器12、处理器13及通信单元14各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。机器人文字书写装置11包括至少一个可以软件或固件(firmware)的形式存储于存储器12中或固化在处理模块10的操作系统(operating system,OS)中的软件功能模块。处理器13用于执行存储器12中存储的可执行模块,例如机器人文字书写装置11所包括的软件功能模块及计算机程序等。
其中,存储器12可以是,但不限于,随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-OnlyMemory,PROM)、可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器12用于存储程序或者数据。
处理器13可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
通信单元14用于通过网络建立处理模块10与其他电子设备之间的通信连接。
本实施例所提供的基于语音控制的机器人文字书写方法应用于机器人文字书写系统100中的处理模块10。需要说明的是,在本实施例中,处理模块10还可以通过通信单元14接收其他设备或者云端传输的语音信息,根据接收到的语音信息,确定书写内容信息和书写形式信息。
可以理解,图3所示的结构仅为示意,处理模块10还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
基于上述图1中的机器人文字书写系统100和图3中的处理模块10,下面给出一种可能的实现方式。可选地,图4为本实施例所提供的基于语音控制的机器人文字书写方法的一种流程示意图,参见图4,该方法包括:
步骤200、根据语音信息确定书写内容信息和书写形式信息。
步骤201、根据书写内容信息和书写形式信息,确定书写内容信息中每个文字对应的运笔轨迹信息。
步骤202、根据每个文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息。
步骤203、将三维运动轨迹指令信息发送至机器人。
在一种示例性的实施方式中,基于机器人文字书写系统100的实现架构,只需要用户对着话筒20说出想要书写的文字,如“书写白日依山尽”,处理模块10便可以通过话筒20获取到用户的语音信息,即书写白日依山尽。而处理模块10在获取得到语音信息后,根据语音信息确定书写内容信息则为“白日依山尽”。
处理模块10在根据语音信息确定书写内容信息和书写形式信息后,根据书写内容信息和书写形式信息,得到书写内容信息中每个文字对应的运笔轨迹信息,即得到“白日依山尽”中每个文字对应的运笔轨迹信息,然后根据每个文字对应的运笔轨迹信息即可生成控制机器人30运笔的三维运动轨迹指令信息,在将该三维运动轨迹指令信息发送至机器人30后,机器人30执行该三维轨迹指令信息,进行文字的书写,即书写“白日依山尽”。
本实施例提供的基于语音控制的机器人文字书写方法,基于人机交互,根据用户的语音信息确定书写内容信息和书写形式信息,根据书写内容信息和书写形式信息确定书写内容信息中每个文字对应的运笔轨迹信息,并根据每个文字对应的运笔轨迹信息生成控制机器人运笔的三维运动轨迹指令信息,将三维运动轨迹指令信息发送至机器人,以使机器人书写文字,实现了文字书写的个性化和定制化,提高了文字书写的效率以及用户的互动体验。
需要说明的是,在本实施例中,书写形式信息可以为书写文字的形式信息,例如字号信息、行距信息等。
作为一种可选的实施方式,书写形式信息可以存储于处理模块10中,在根据语音信息确定书写内容信息后,可直接基于存储于处理模块10中的书写形式信息,确定书写形式信息。
作为另一种可选的实施方式,书写形式信息还可以通过用户输入。例如上述用户可以通过语音给出具体书写内容信息的同时,还可以给出所需的书写形式信息。例如,用户给出的语音信息为“书写白日依山尽,风格宋体”,其中,风格宋体则为所需的书写形式信息,即本实施例的书写形式信息还可以包括字体信息。
可选地,在图4的基础上,图5为一种子步骤流程示意图。参见图5,步骤200的一种可能的实现方式为:
步骤200-1、通过语音特征提取获得语音信息中的书写内容信息和字体信息。
对应的,则步骤201的一种可能的实现方式为:
步骤201-1、根据字体信息,调用字体库中书写内容信息中每个文字对应的坐标信息以及运笔信息。
例如,用户输入的语音信息为“书写白日依山尽,字体宋体”,通过语音特征提取,可以得到语音信息中的书写内容信息为“白日依山尽”,字体信息为“宋体”。
在本实施例中,可通过语音信息中的关键词进行语音特征的提取。例如,语音信息为“书写白日依山尽,风格宋体”,其关键词可为“书写、写、字体”,根据关键词进行语音特征提取,则可以定位到语音信息中的书写内容信息为“白日依山尽”,字体信息为“宋体”。
在得到书写内容信息以及字体信息后,则可根据书写内容信息和字体信息,确定书写内容信息中每个文字对应的运笔轨迹信息。
可选的,在本实施例中,每个文字对应的运笔轨迹信息包括每个文字对应的坐标信息以及运笔信息。其中,每个文字对应的坐标信息与字体信息匹配,每个文字对应的运笔信息包括每个文字的笔画顺序以及笔画宽度。
例如,以书写内容信息为“白日依山尽”,字体信息为“宋体”为例,则调用字体库中宋体风格的“白日依山尽”中的每个文字对应的坐标信息以及运笔信息。
在本实施例中,字体库存储有多个汉字,以及每个汉字对应的运笔信息和每个汉字对应的不同风格的字体信息和坐标信息。例如,对于“白”字,字体库存储有字体为宋体的“白”字、楷体的“白”字以及黑体的“白”字等等。而同一个文字,不同的字体,其坐标信息可以是不同的,因此,本实施例中,每个文字对应的坐标信息与字体信息匹配。
在确定书写内容信息中每个文字对应的运笔轨迹信息后,则可根据每个文字的运笔轨迹信息生成控制机器人运笔的三维运动轨迹指令信息,并将该三维运动轨迹指令信息发送至机器人,进而机器人在接收到该三维运动轨迹指令信息后,执行该三维运动轨迹指令信息,即可书写文字。
在另一种可能的实现方式中,用户也可以对排版形式通过语音进行要求,例如,要求以横版或竖版进行书写。则此时,该书写形式信息可以为排版信息,即本实施例的书写形式信息还可以包括为排版信息。可选地,在图4的基础上,图6为一种子步骤流程示意图。参见图6,步骤202的一种可能的实现方式为:
步骤202-1、根据每个文字对应的运笔轨迹信息和排版信息,生成控制机器人运笔的三维运动轨迹指令信息。
例如,用户输入的语音信息为“书写白日依山尽,风格竖版”。通过语音特征提取,可以得到语音信息中的书写内容信息为“白日依山尽”,风格为“竖版”。在获得“白日依山尽”中每个文字对应的运笔轨迹信息后,则可根据每个文字对应的运笔轨迹信息和竖版信息,生成控制机器人的三维运动轨迹信息,然后机器人可根据该三维运动轨迹指令信息,以竖版的形式书写文字。
可选地,图7为本发明实施例提供的另一种机器人文字书写系统100的结构示意图,参见该图7,该机器人文字书写系统100还可以包括:视觉模块40。该视觉模块40与处理模块10数据连接。在另一种可能的实现方式中,该视觉模块40可以由一个或多个摄像头构成。在该机器人文字书写系统100的架构下,还可以利用书写内容信息(例如文字量)和书写范围(例如纸面大小)对每个文字进行缩放处理。可选地,在图4的基础上,图8为本实施例所提供的机器人文字书写方法的另一种流程示意图。参见图8,在步骤202之前,还包括:
步骤204、根据识别的待书写区域信息确定书写范围信息。
步骤205、根据书写内容信息和书写范围信息对每个文字对应的运笔轨迹信息进行缩放,以使每个文字对应的运笔轨迹信息与书写范围信息匹配。
例如,根据视觉模块40识别的待书写区域信息确定的书写范围信息为一张A4纸的范围,若此时书写内容信息包括的文字的数量较多,且以当前每个文字的运笔轨迹信息,在该A4纸的范围内无法写下所有的文字,则以当前的书写范围,即该A4纸的范围,对每个文字对应的运笔轨迹信息进行缩小,以能够在该A4纸的范围内写下所有的文字。
又例如,若此时书写内容信息包括的文字的数量较少,且以当前每个文字的运笔轨迹信息,书写在该A4纸的范围内,会留有大量的空白区域,则以当前的书写范围,即该A4纸的范围,对每个文字对应的运笔轨迹信息进行放大,以在该A4纸的范围内合理布局文字,使书写内容信息所包括的文字能填满该A4纸的范围。
在一种场景中,该机器人文字书写系统100还可以具备自动匹配书写内容的功能,例如,根据用户语音给出的某一句诗、话,通过与内容库的内容匹配,获得下一句诗句或其他文字内容,进而将完整的文字书写出来。在一中可能的实现方式中,可选地,在图4的基础上,图9为步骤200的又一种子步骤流程示意图。参见图9,步骤200的一种可能的实现方式为:
步骤200-1、根据语音信息获得待匹配文字内容和书写形式信息。
步骤200-2、根据待匹配文字内容在内容库中确定与待匹配文字内容对应的关联文字内容。
步骤200-3、将待匹配文字内容和关联文字内容作为书写内容信息。
例如,用户输入的语音信息为“书写白日依山尽”,则根据语音信息获得的待匹配文字内容为白日依山尽,将待匹配文字内容在内容库中的内容进行匹配,确定与待匹配文字内容对应的关联文字内容为“黄河入海流”。
需要说明的是,为了便于书写以及提高书写文字的可观性,在本实施例中,关联文字内容和待匹配文字内容的书写形式信息一致,即排版信息一致、字体信息一致以及字号信息一致等。例如,根据用户输入的语音信息获得的书写形式信息为“宋体”,则根据待匹配文字内容获得的关联文字内容的书写形式信息也为“宋体”。
在获得关联文字内容后,将待匹配文字内容和关联文字内容作为书写内容信息,然后基于书写内容信息和书写形式信息书写文字。
对于上述各个附图所示的实现方式,其可以单独执行,也可以根据用户的语音信息进行组合,例如,书写形式信息可以同时包括字体信息以及排版信息,根据语音特征提取可同时获取语音信息的书写内容信息、字体信息以及排版信息等,然后根据字体信息,调用字体库中书写内容信息中每个文字对应的运笔轨迹信息,根据每个文字对应的运笔轨迹信息和排版信息,生成控制机器人运笔的三维运动轨迹指令信息。此处对于上述实现方式的组合形式不予限定。
本实施例所提供的基于语音控制的机器人文字书写方法,通过人机交互实现机器人书写文字,基于语音识别,确定书写内容信息和书写形式信息,实现了智能化、个性化的书写功能,具有良好的交互体验,且书写效率高,书写文字准确,可观性高,可大面积推广应用。
在上述基础上,请结合参阅图10,本实施例还提供一种基于语音控制的机器人文字书写装置11,应用于机器人文字书写系统100中的处理模块10,机器人文字书写装置11包括内容确定单元111、处理单元112以及执行单元113。
内容确定单元111用于根据语音信息确定书写内容信息和书写形式信息。
处理单元112用于根据书写内容信息和书写形式信息,确定书写内容信息中每个文字对应的运笔轨迹信息。
执行单元113用于根据每个文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,并将三维运动轨迹指令信息发送至机器人。
在可选的实施方式中,书写形式信息包含字体信息。
内容确定单元111用于通过语音特征提取获得语音信息中的书写内容信息和字体信息。
处理单元112用于根据字体信息,调用字体库中书写内容信息中每个文字对应的坐标信息以及运笔信息;每个文字对应的坐标信息与字体信息匹配,每个文字对应的运笔信息包括笔画顺序以及笔画宽度。
在可选的实施方式中,书写形式信息包含排版信息。
执行单元113用于根据每个文字对应的运笔轨迹信息和排版信息,生成控制机器人运笔的三维运动轨迹指令信息。
在可选的实施方式中,装置还包括范围确定单元114。
范围确定单元114用于根据识别的待书写区域信息确定书写范围信息,并根据书写内容信息和书写范围信息对每个文字对应的运笔轨迹信息进行缩放,以使每个文字对应的运笔轨迹信息与书写范围信息匹配。
在可选的实施方式中,内容确定单元111用于根据语音信息获得待匹配文字内容和书写形式信息,并根据待匹配文字内容在内容库中确定与待匹配文字内容对应的关联文字内容,将待匹配文字内容和关联文字内容作为书写内容信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的机器人文字书写装置11的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
在上述基础上,本发明实施例提供一种存储介质,存储介质中存储有处理模块程序,处理模块程序被执行时实现前述实施方式中任意一项的基于语音控制的机器人文字书写方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储介质的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上,本实施例提供的基于语音控制的机器人文字书写方法、装置和系统,根据获取得到的语音信息确定书写内容信息和书写形式信息,然后根据书写内容信息和书写形式信息确定书写内容信息中每个文字对应的运笔轨迹信息,并根据每个文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,将三维运动轨迹指令信息发送至机器人,以使机器人执行三维运动轨迹指令信息,书写文字,实现了文字书写的个性化和定制化,并且通过人机交互,提高了用户体验。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和处理模块程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与处理模块指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个处理模块可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该处理模块软件产品存储在一个存储介质中,包括若干指令用以使得一台处理模块设备(可以是个人处理模块,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于语音控制的机器人文字书写方法,其特征在于,包括:
根据语音信息确定书写内容信息和书写形式信息;
根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息;
根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息;
将所述三维运动轨迹指令信息发送至所述机器人。
2.根据权利要求1所述的基于语音控制的机器人文字书写方法,其特征在于,所述书写形式信息包含字体信息;所述根据语音信息确定书写内容信息和书写形式信息的步骤,包括:
通过语音特征提取获得所述语音信息中的所述书写内容信息和所述字体信息;
根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息的步骤,包括:
根据所述字体信息,调用字体库中所述书写内容信息中每个文字对应的坐标信息以及运笔信息;所述每个文字对应的坐标信息与所述字体信息匹配,所述每个文字对应的运笔信息包括笔画顺序以及笔画宽度。
3.根据权利要求1所述的基于语音控制的机器人文字书写方法,其特征在于,所述书写形式信息包含排版信息;所述根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息的步骤,包括:
根据每个所述文字对应的运笔轨迹信息和所述排版信息,生成控制所述机器人运笔的三维运动轨迹指令信息。
4.根据权利要求1所述的基于语音控制的机器人文字书写方法,其特征在于,在所述根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息的步骤之前,还包括:
根据识别的待书写区域信息确定书写范围信息;
根据所述书写内容信息和所述书写范围信息对每个文字对应的运笔轨迹信息进行缩放,以使所述每个文字对应的运笔轨迹信息与所述书写范围信息匹配。
5.根据权利要求1所述的基于语音控制的机器人文字书写方法,其特征在于,所述根据语音信息确定书写内容信息的步骤,包括:
根据所述语音信息获得待匹配文字内容和所述书写形式信息;
根据所述待匹配文字内容在内容库中确定与所述待匹配文字内容对应的关联文字内容;
将所述待匹配文字内容和所述关联文字内容作为所述书写内容信息。
6.一种基于语音控制的机器人文字书写装置,其特征在于,所述机器人文字书写装置包括内容确定单元、处理单元以及执行单元;
所述内容确定单元用于根据语音信息确定书写内容信息和书写形式信息;
所述处理单元用于根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息;
所述执行单元用于根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,并将所述三维运动轨迹指令信息发送至所述机器人。
7.根据权利要求6所述的基于语音控制的机器人文字书写装置,其特征在于,所述书写形式信息包含字体信息;
所述内容确定单元用于通过语音特征提取获得所述语音信息中的所述书写内容信息和所述字体信息;
所述处理单元用于根据所述字体信息,调用字体库中所述书写内容信息中每个文字对应的坐标信息以及运笔信息;所述每个文字对应的坐标信息与所述字体信息匹配,所述每个文字对应的运笔信息包括笔画顺序以及笔画宽度。
8.根据权利要求6所述的基于语音控制的机器人文字书写装置,其特征在于,所述内容确定单元用于根据所述语音信息获得待匹配文字内容和所述书写形式信息,并根据所述待匹配文字内容在内容库中确定与所述待匹配文字内容对应的关联文字内容,将所述待匹配文字内容和所述关联文字内容作为所述书写内容信息。
9.一种基于语音控制的机器人文字书写系统,其特征在于,包括话筒、机器人以及处理模块;
所述话筒用于采集语音信息;
所述处理模块用于根据所述语音信息确定书写内容信息和书写形式信息,根据所述书写内容信息和所述书写形式信息,确定所述书写内容信息中每个文字对应的运笔轨迹信息,根据每个所述文字对应的运笔轨迹信息,生成控制机器人运笔的三维运动轨迹指令信息,并将所述三维运动轨迹指令信息发送至所述机器人。
10.一种存储介质,其特征在于,所述存储介质中存储有处理模块程序,所述处理模块程序被执行时实现权利要求1-5中任意一项所述的基于语音控制的机器人文字书写方法。
CN201911422323.9A 2019-12-30 2019-12-30 基于语音控制的机器人文字书写方法、装置和系统 Pending CN111178019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911422323.9A CN111178019A (zh) 2019-12-30 2019-12-30 基于语音控制的机器人文字书写方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911422323.9A CN111178019A (zh) 2019-12-30 2019-12-30 基于语音控制的机器人文字书写方法、装置和系统

Publications (1)

Publication Number Publication Date
CN111178019A true CN111178019A (zh) 2020-05-19

Family

ID=70652328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911422323.9A Pending CN111178019A (zh) 2019-12-30 2019-12-30 基于语音控制的机器人文字书写方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111178019A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626036A (zh) * 2020-05-27 2020-09-04 南京蓝鲸人网络科技有限公司 一种新型的图文排版处理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102528790A (zh) * 2010-12-10 2012-07-04 上海理工大学 基于力反馈的书法机器人系统
CN104851333A (zh) * 2015-04-13 2015-08-19 武汉光谷百桥国际生物科技有限公司 字帖生成装置及字帖临摹装置
CN106775557A (zh) * 2016-11-28 2017-05-31 墨宝股份有限公司 一种智能机器人与虚拟3d的交互系统及方法
CN206833737U (zh) * 2017-03-17 2018-01-02 辽宁大学 语音写字多功能教育机器人
CN108230818A (zh) * 2018-01-25 2018-06-29 上海顺砾智能科技有限公司 一种多功能电子书写本及其使用方法
CN109664300A (zh) * 2019-01-09 2019-04-23 湘潭大学 一种基于力觉学习的机器人多风格书法临摹方法
CN110175539A (zh) * 2019-05-10 2019-08-27 广东智媒云图科技股份有限公司 一种文字创建方法、装置、终端设备以及可读存储介质
CN110488997A (zh) * 2019-07-03 2019-11-22 深圳市九洲电器有限公司 基于语音的书写板实现方法及相关产品
CN110576439A (zh) * 2019-09-04 2019-12-17 华南理工大学广州学院 一种多重控制的写字机器人及其控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102528790A (zh) * 2010-12-10 2012-07-04 上海理工大学 基于力反馈的书法机器人系统
CN104851333A (zh) * 2015-04-13 2015-08-19 武汉光谷百桥国际生物科技有限公司 字帖生成装置及字帖临摹装置
CN106775557A (zh) * 2016-11-28 2017-05-31 墨宝股份有限公司 一种智能机器人与虚拟3d的交互系统及方法
CN206833737U (zh) * 2017-03-17 2018-01-02 辽宁大学 语音写字多功能教育机器人
CN108230818A (zh) * 2018-01-25 2018-06-29 上海顺砾智能科技有限公司 一种多功能电子书写本及其使用方法
CN109664300A (zh) * 2019-01-09 2019-04-23 湘潭大学 一种基于力觉学习的机器人多风格书法临摹方法
CN110175539A (zh) * 2019-05-10 2019-08-27 广东智媒云图科技股份有限公司 一种文字创建方法、装置、终端设备以及可读存储介质
CN110488997A (zh) * 2019-07-03 2019-11-22 深圳市九洲电器有限公司 基于语音的书写板实现方法及相关产品
CN110576439A (zh) * 2019-09-04 2019-12-17 华南理工大学广州学院 一种多重控制的写字机器人及其控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邢淑敏: "基于风格迁移的机器人书法临摹技术研究", 中国优秀硕士学位论文全文数据库 哲学与人文科学辑 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626036A (zh) * 2020-05-27 2020-09-04 南京蓝鲸人网络科技有限公司 一种新型的图文排版处理方法

Similar Documents

Publication Publication Date Title
US8600163B2 (en) Handwriting determination apparatus and method and program
US20220350955A1 (en) System and method for collaborative ink management
JP2020155129A (ja) ジェスチャー認識方法、ジェスチャー認識装置、電子機器、及び記憶媒体
KR102470522B1 (ko) 핸드라이팅된 다이어그램 커넥터들의 관리를 위한 시스템 및 방법
KR102428704B1 (ko) 핸드라이팅된 다이어그램 커넥터들의 인식을 위한 시스템 및 방법
JP2009093291A (ja) ジェスチャー判定装置及び方法
US9600094B2 (en) Apparatus, method, and program product for directing motion of a writing device
JP6914260B2 (ja) デジタルインクを美しくするためのシステム及び方法
CN109732593B (zh) 一种机器人的远端控制方法、装置及终端设备
EP3796145A1 (en) A method and correspond device for selecting graphical objects
CN108027648A (zh) 一种可穿戴设备的手势输入方法及可穿戴设备
CN104881673A (zh) 基于信息整合的模式识别的方法和系统
CN111152234A (zh) 用于机器人的书法临摹方法、装置及机器人
CN111178019A (zh) 基于语音控制的机器人文字书写方法、装置和系统
CN110175539B (zh) 一种文字创建方法、装置、终端设备以及可读存储介质
CN109877828A (zh) 机器点位调试方法、装置、计算机设备和存储介质
US11383386B2 (en) Robotic drawing
CN111185902B (zh) 基于视觉识别的机器人文字书写方法、装置和书写系统
CN101866240A (zh) 一种手写输入方法及具有手写输入功能的装置
CN102246158A (zh) 用户指定的短语输入学习
Yussof et al. Algorithm for robot writing using character segmentation
JP6375441B2 (ja) 組立教示装置、および組立教示方法
CN113326876A (zh) 一种通过强化学习训练书法机器人的方法
Desai et al. Speech enabled handwriting machine using CNC
CN112248006A (zh) 机械臂毛笔字书写控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination