CN103106403B - 一种基于图像处理及乐符知识的音符基元分割方法 - Google Patents
一种基于图像处理及乐符知识的音符基元分割方法 Download PDFInfo
- Publication number
- CN103106403B CN103106403B CN201310004704.1A CN201310004704A CN103106403B CN 103106403 B CN103106403 B CN 103106403B CN 201310004704 A CN201310004704 A CN 201310004704A CN 103106403 B CN103106403 B CN 103106403B
- Authority
- CN
- China
- Prior art keywords
- note
- spectral line
- music score
- segment
- primitive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
一种基于图像处理及乐符知识的音符基元分割方法,所利用到的音符知识主要是音符的形状(空心实心等)决定发音长短,音符相对于谱线的位置决定发音的高低。由于乐谱符号的空间多样性,通常需要将乐谱对象分割成最基本的基元,以减轻乐谱识别的负担并提高识别率。本发明根据音符及发音规则的特点提出了基于音符知识及布尔运算的基元分割方法,先用投影法去掉谱线再用布尔运算和膨胀、腐蚀将乐谱分割成包含音符及谱线的所有特征的基元。
Description
技术领域
本发明涉及图像处理技术领域,尤其是在数字音乐图书馆等音乐乐谱数字化应用开发的领域。
背景技术
光学乐谱技术是今年来发展起来的实现纸质乐谱数字化的一种主流技术,不同于传统的图像储存格式,采用光学扫描压缩储存乐谱图像,而是记录乐谱所表达的音乐内容,因而所需要的储存空间更小,并且可以很方便的对其进行编辑、加工、打印、传播或者实时演奏。OMR技术为纸质乐谱的数字化提供了一个智能、高效、的新途径,可以广泛的应用在计算机辅助音乐教学、数字音乐图书馆建设、互联网音乐搜索、计算机音乐合成等领域。
国外有关OMR的研究起始于60年代后期,当时由于技术条件和硬件设备的限制,所研究的内容也是非常有限的。到了70年代后期,随着光学扫描仪的出现和机器性能的提升,OMR才真正引起众多学者的广泛关注。进入80年代后,随着计算机图形图像技术的不断发展与成熟,研究内容越来越深入,部分研究成果也正逐步进入实用阶段。
在我国,一方面由于计算机音乐发展起步晚,计算机音乐只是少数音乐工作者的“专利”,社会缺乏计算机识别乐谱的需要;另一方面,由于国内高校学科设置综合化程度、学科交叉度与国外有着相当大的差距,长期以来看,从事计算机音乐研究的专业人才严重缺乏。因此,OMR技术在国内的系统研究和实践工作几乎为空白。目前,西北工业大学与西安音乐学院合作正在展开印刷体光学乐谱识别技术的研究,但目前国内外仍然占有十分重要的地位,但该方法对于基元的分割的效率不高,须待进一步提高。
发明内容
本发明的目的就是为克服上述现有技术存在的缺陷和不足,而提供一种基于图像处理及乐符知识的音符基元分割方法。
采用的技术方案是:
一种基于图像处理及乐符知识的音符基元分割方法,其特征在于包括以下步骤:
1、利用投影法删除谱线,得到没有谱线的音符;
2、将上一步得到的音符进行纵向膨胀,将其变形为一长条;
3、用原乐谱的二值图与去掉谱线的音符图进行差集,得到谱线;
4、用步骤2得到的结果和谱线进行交集,将谱线按音符位置大小分割为小段。
5、将划分为小段的谱线和步骤1得到的音符进行并集,得到每个音符都有小段谱线定位高低音的音符;
6、用步骤4得到的小段谱线进行纵向拉膨胀长条,再横纵少许膨胀,用横纵膨胀后的长条与横纵膨胀前的长条差集,得到矩形框,其作用是为了音符的划分;
7、将步骤5与步骤6的结果作并集,得到被矩形框框住的有小段谱线定位高低音的音符;
8、将步骤7得到的结果按像素连续进行图像划分,得到单个的矩形框;
9、按乐谱顺序和事先录入的音符库逐个对比单个矩形框的音符发音,存入发音矩阵;
10、将发音矩阵内容播放出来。
本发明的方法不仅能识别出音符的种类,同时保存其与谱线的相对位置,完整保留了音符的所有信息。
附图说明
图1是本发明删除谱线后的音符。
图2是本发明差集得到的谱线。
图3是本发明交集得到的分割谱线。
图4是本发明并集得到的谱线定位音符。
图5是本发明膨胀差集得到的矩形框。
图6是本发明前处理目标结果。
图7是本发明音符划分出的单个可识别基元。
具体实施方式
一种基于图像处理及乐符知识的音符基元分割方法,具体包括以下步骤:
(1)利用投影法删除谱线,得到没有谱线的音符。
(2)将上一步得到的音符进行纵向膨胀,将其变形为一长条。
(3)对乐谱的二值图进行转置,将用投影法删除谱线的图image2,用二值图image1和去掉谱线的image2作差,得到谱线。
(4)用image2进行线性水平膨胀得到长条与谱线进行交集得到和音符位置对应的小段谱线puxian1,用小段谱线puxian1再次水平膨胀成长条与谱线puxian相交得到规则的小段谱线,赋予puxian1。
(5)用puxian1以strel(line‘,30,0’)进行水平膨胀成为一个规则矩形条,再将这个矩形条以ones(3,3)进行膨胀得到一个大一点的矩形条。将这两个矩形条进行差集得到一个矩形框kuang。
(6)将用投影法删除的图image2、规则的谱线段puxian1与矩形框kuang进行并集运算,得到重建的乐谱image5。
(7)将image5进行转置得到前处理最终结果image10。
(8)对图像进行按像素连续分割,并与录入的音符发音库对比,得到发音存于矩阵yin,播放矩阵yin。
乐谱识别主程序包括以下流程:
关闭清理上次运行的结果
warningoff
clc,closeall,clearall
读入乐谱
image1=imread('yuepu\10.jpg');
变为二值图像
image1=rgb2gray(image1);
image1=im2bw(image1);
转置取反
image1=image1';
image1=~image1;
投影法删除谱线
[m,n]=size(image1);
image1=bwareaopen(image1,15);%去噪
touying=sum(image1);
a2=1:length(touying);
figure
plot(a2,touying(a2));
a1=.7*max(touying);
[i1,j1]=find(touying>a1);
image2=image1;
image2(:,j1)=0;
显示删除谱线的结果
figure
imshow(image2);
以下是权利要求部分的函数
差集得到谱线
puxian=image1-image2;
显示谱线
figure
imshow(puxian);
分割谱线
se=strel('line',60,0);
image3=imdilate(image2,se);
image4=image3.*puxian;
se=strel('line',60,0);
image4=imdilate(image4,se);
puxian1=image4.*puxian;
se=strel('line',4,90);
puxian1=imdilate(puxian1,se);
显示分割的谱线
figure
imshow(puxian1)
得到矩形框
se=strel('line',30,0);
kuang1=imdilate(puxian1,se);
se=ones(3,3);
kuang2=imdilate(kuang1,se);
kuang=kuang2-kuang1;
显示矩形框
figure
imshow(kuang)
并集得到乐谱重建结果
image5=image2+puxian1+kuang-image2.*puxian1.*kuang;
image10=image5';%转置
显示乐谱重建结果
figure
imshow(image10)
以上是权利要求部分函数
yin=[];
re=image10;
加载全局变量
loadtemplates
globaltemplates
num_letras=size(templates,2);
[row,col]=find(re==1,1,'first');
re(row,col)=0;
while1
横向分割乐谱
[flre]=lines(re);
imgn=fl;
纵向分割乐谱得到乐谱基元
[LNe]=bwlabel(imgn);
逐个音符基元对比识别
forn=1:Ne
[r,c]=find(L==n);
n1=imgn(min(r):max(r),min(c):max(c));
img_r=imresize(n1,[10025]);
iii=im2bw(img_r);
letter=read_letter(iii,num_letras);
将音符发音装入乐谱发音矩阵
yin=[yinletter];
end
ifisempty(re)
break
end
end
播放乐谱发音矩阵
sound(yin);
clearall。
Claims (1)
1.一种基于图像处理及乐符知识的音符基元分割方法,其特征在于包括以下步骤:
a、利用投影法删除谱线,得到没有谱线的音符;
b、将上一步得到的音符进行纵向膨胀,将其变形为一长条;
c、用原乐谱的二值图与去掉谱线的音符图进行差集,得到谱线;
d、用步骤b得到的结果和谱线进行交集,将谱线按音符位置大小分割为小段;
e、将划分为小段的谱线和步骤a得到的音符进行并集,得到每个音符都有小段谱线定位高低音的音符;
f、用步骤d得到的小段谱线进行纵向拉膨胀长条,再横纵膨胀,用横纵膨胀后的长条与横纵膨胀前的长条差集,得到矩形框,其作用是为了音符的划分;
g、将步骤e与步骤f的结果作并集,得到被矩形框框住的有小段谱线定位高低音的音符;
h、将步骤g得到的结果按像素连续进行图像划分,得到单个的矩形框;
l、按乐谱顺序和事先录入的音符库逐个对比单个矩形框的音符发音,存入发音矩阵;
n、将发音矩阵内容播放出来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310004704.1A CN103106403B (zh) | 2013-01-08 | 2013-01-08 | 一种基于图像处理及乐符知识的音符基元分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310004704.1A CN103106403B (zh) | 2013-01-08 | 2013-01-08 | 一种基于图像处理及乐符知识的音符基元分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103106403A CN103106403A (zh) | 2013-05-15 |
CN103106403B true CN103106403B (zh) | 2016-08-03 |
Family
ID=48314252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310004704.1A Active CN103106403B (zh) | 2013-01-08 | 2013-01-08 | 一种基于图像处理及乐符知识的音符基元分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103106403B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646247B (zh) * | 2013-09-26 | 2016-11-23 | 惠州学院 | 一种乐谱识别方法 |
CN103544942B (zh) * | 2013-11-12 | 2016-01-13 | 重庆大学 | 声信号乐谱化处理系统 |
CN114419634B (zh) * | 2022-03-28 | 2022-07-26 | 之江实验室 | 一种基于特征规则的曲谱解析方法与装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5864631A (en) * | 1992-08-03 | 1999-01-26 | Yamaha Corporation | Method and apparatus for musical score recognition with quick processing of image data |
WO2000034942A1 (en) * | 1998-12-11 | 2000-06-15 | Sunhawk Corporation | Method and system for recognizing musical notations using a compass-direction user interface |
CN101944180A (zh) * | 2010-09-07 | 2011-01-12 | 东南大学 | 基于乐符知识及双投影法的乐符基元分割方法 |
CN101964049A (zh) * | 2010-09-07 | 2011-02-02 | 东南大学 | 基于分段投影与乐符结构的谱线检测及删除方法 |
-
2013
- 2013-01-08 CN CN201310004704.1A patent/CN103106403B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5864631A (en) * | 1992-08-03 | 1999-01-26 | Yamaha Corporation | Method and apparatus for musical score recognition with quick processing of image data |
WO2000034942A1 (en) * | 1998-12-11 | 2000-06-15 | Sunhawk Corporation | Method and system for recognizing musical notations using a compass-direction user interface |
CN101944180A (zh) * | 2010-09-07 | 2011-01-12 | 东南大学 | 基于乐符知识及双投影法的乐符基元分割方法 |
CN101964049A (zh) * | 2010-09-07 | 2011-02-02 | 东南大学 | 基于分段投影与乐符结构的谱线检测及删除方法 |
Non-Patent Citations (2)
Title |
---|
光学乐谱识别技术研究;何欢;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110815(第8期);全文 * |
基于Hausdorff距离的乐谱图像识别研究;马晔谦;《中国优秀硕士学位论文全文数据库 信息科技辑》;20070915(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103106403A (zh) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103106403B (zh) | 一种基于图像处理及乐符知识的音符基元分割方法 | |
CN1588350A (zh) | 一种含书写时序信息的动态汉字字库的处理方法及其应用 | |
US8943431B2 (en) | Text operations in a bitmap-based document | |
CN101944180A (zh) | 基于乐符知识及双投影法的乐符基元分割方法 | |
KR101198723B1 (ko) | 언어 학습 프로그램을 저장하는 컴퓨터로 판독 가능한 기록매체 | |
CN102339535A (zh) | 课文学习系统及其方法 | |
CN109308402A (zh) | 曲面钢箱桥梁设计数据的提取方法 | |
Torvinen | Resounding: Feeling, Mytho-ecological Framing, and the Sámi Conception of Nature in Outi Tarkiainen's The Earth, Spring's Daughter | |
US20130155098A1 (en) | Adjusting Fonts for Visual Consistency | |
Zirkle | Heinrich Graetz and the exegetical contours of Modern Jewish History | |
Benefiel et al. | Documenting Ancient Graffiti: Text, Image, Support and Access | |
JP2009048351A (ja) | 情報検索装置、情報検索方法および情報検索プログラム | |
CN108009213A (zh) | 一种批量生成Word文档的方法及装置 | |
Liu et al. | A√ 3-Subdivision Algorithm for Holding Sharp Features | |
KR102235027B1 (ko) | 박자 시각화 장치, 방법 및 성악용 박자 보표 | |
KASTEN et al. | Report on OG (H) AM: Harnessing digital technologies to transform understanding of ogham writing, from the 4th century to the 21st | |
Dunphy | The Pelagian Controversy: An Introduction to the Enemies of Grace and the Conspiracy of Lost Souls by Stuart Squires | |
Adžović | Book Review: Milan Milojković, Ira Prodanov, Adriana Sabo, and Ljubica Ilić, Vodič kroz pank kulturu u Novom Sadu [A Guide to Punk Culture in Novi Sad] | |
Bhonsle | Generating Datasets with Glyph-level Annotations for Devanagari Text Recognition | |
Mirzaei Kootenaei et al. | Acculturation and its Impact on the Changes of Techniques, Structure, and Repertoire of Narmey Ney in Contemporary Period | |
Kwok | Dis/re-appearance of vernacular Chinese letterform of Beiwei Kaishu in Hong Kong | |
JP3926175B2 (ja) | Csg方式三次元cadにおける任意面の編集方法及びコンピュータプログラム | |
Hoy | What we're listening to: Dissect | |
Lawton | Guobao chenfou lu: Gugong sanyi shuhua jianwen kaolüe (" Record of the Vicissitudes of National Treasures: Investigation of the Dispersed and Lost Calligraphies and Paintings from the Former Palace That I Have Seen and Heard About") | |
Brooks | National Atlas of Canada Producing First Map Using Automated Generalisation of Framework Data. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |