您的位置: turnitin查重官网> 经济 >> 政治经济学 >网络时代下音乐检索策略

网络时代下音乐检索策略

收藏本文 2024-03-30 点赞:2891 浏览:7262 作者:网友投稿原创标记本站原创

【摘 要】基于网络时代下,人们对于音乐作品的需要越来越多样化,个性化,现有的文字音乐检索方法已经不能适用于时代的需要。文章根据市场需要提出一个哼唱旋律的音乐检索方法,并展望了该方法广阔的市场前景和巨大的商业利润。
【关键词】文字检索方法;音乐检索方法;MIDI文件;检索算法

1.音乐检索的现状

进入网络新时代以来,艺术创意产业的发展受到高度的重视。艺术与技术有着天然的不解之缘,艺术借助技术的手段构建了艺术的“轮廓”,技术也因为有了艺术上的感觉获得了特有的“神情”。如何找到最合适的技术使艺术创意产业转换成生产力并且怎么写作于现实的生活,这是个有着实际意义的科研项目。现在对音乐有许多的检索方法,但是如何快速准确的检索,这个就不是那么容易了。
随着多媒体和计算机网络技术的迅速发展,各式各样的数字信息呈现几何增长的爆炸态势,其中音乐信息资源的数量也是急剧增长。音乐信息资源是非结构化信息,许多是文字无法精准描述的。目前网络音乐资源呈现出几个特点:一是资源类型多,数量大;二是对音乐描述的文字方案繁杂,没有统一的标准;三是许多描述方案并不准确。因此,如何从浩如烟海的音乐信息资源中快速而准确的检索到想要的信息,已经逐渐发展为一个新兴的热门研究方向。
根据《第21次中国互联网络发展状况统计报告》显示:截至2007年12月31日,中国网民总人数达到2.1亿。在网络的各项用途中,中国网民的网络音乐检索率居各项网络应用之首,半年内已有86.6%的网民收听过网络音乐,还有71.2%的人半年内下载过音乐。如此看来,网络已经成为获取音乐、传播音乐的重要的途径。音乐检索已经渗透到人们的日常生活学习工作当中,有着清晰的发展前景和广阔的市场空间以及巨大的商业利润。

2.文字检索方法的局限

目前的音乐检索方法大多是文字检索,即根据乐曲的名字、曲作者、词作者、演唱者、国别、文件格式、演奏乐器等人工标注的文字信息来进行检索。但是随着音乐信息资源海量地增长,人工标注信息的速度远远无法赶上音乐信息增长的速度,而且用户对音乐检索提出越来越高的要求与期望,基于文本的检索方法检索出来的结果或者描述不详细、或者根本无法达到用户的需求,文字检索的方法已经无法满足用户。
为了能够快速、准确的对海量的无文字标注的音乐信息资源做出有效的检索,本文提出哼唱旋律的音乐检索方法。哼唱旋律的音乐检索方法是根据音乐的内容来进行检索,也就是根据音乐的旋律、节奏、音高、时长等音乐特征来进行检索的一种方法。人们经常记不清一些歌曲的歌名和演唱者,但是对歌曲中经典的旋律却难以忘怀,基于这种特征利用哼唱旋律的检索方法就具有无可比拟的优势。当人们需要检索音乐信息的时候,进入哼唱旋律的系统,只要哼唱出歌曲的一句或者几句旋律,即使不知道音乐作品的名字、词曲作者或者演唱者,也能很顺利的检索到需要的音乐信息资源。

3.音乐的旋律及表达

音乐的旋律就是由一系列能反映音乐主题的音符组成,能够充分显示音乐的内容特征。构成音乐的基本单位是音符,音符由三个因素构成——音调、响度、音色。音调与声音的频率有关,频率越高,音

源于:论文格式模板www.udooo.com

调越高。响度与声音的振幅有关,响度的决定因素有发声体振动的幅度和距离。音色与声音的波形相关,不同的乐器有不同的音色。音符还有一个重要特征——音长,又称时值,即每个音的延长的时间长度或节拍。由于音乐本身的特点,音乐检索不同于一般的音频检索,更不同于传统意义上的文字检索。

3.1 旋律特征的表达和提取

首先确定哼唱的主旋律,去掉非主旋律,这样可以找到最准确的主旋律。
其次用音乐的要素:音强、音色、音高、时值长短来描述旋律的特征。因为实际操作过程中,用户哼唱的时候音色或者强弱往往把握不准确,故用更多的音乐元素来表达旋律特征。
再次综合使用音高、音长和音强特征来表达旋律。对于用户的哼唱习惯的研究表明,人们很难准确地把握住每个音符的音高和节奏的变化,但是对于音高和时值大概的轮廓却能很准确的哼唱出来。因此采用音高差与音长比作为二维特征,这样就能将不同的旋律转化为具体的字符串。
绝对音高音长的序列是没有意义的,应采用相对音高音长序列来表示音高的升高、降低和相同的三种情况。当然能够更细化旋律的轮廓,会减少误差,有助于提高检索的成功率。用户在哼唱旋律时一般对音高比时长的把握更准确些,通过识别哼唱的旋律轮廓中音高的比重应该大于时长。

3.2 常用的音频文件格式的比较

根据音频文件记录声音的原理,通常可以分为三类:声音文件、MIDI文件和模块文件。声音文件(w、aiff、au、mp3、ra、wma等)指的是直接记录了通过对真实声音的模拟波形进行二进制采样而得到的数据,是对声音的真实反映。但是这样存储声音信息所产生的声音文件是相当庞大的。
MIDI文件(mid、rmi)记录的是音乐演奏指令序列,说明了在什么时间、用什么乐器演奏什么音符,及如何演奏,并不包含真实声音的数据,所以文件尺寸要比声音文件小得多。
模块文件(mod、s3m、xm、mtm、far、kar、it等)同时具有MIDI与声音文件的共同特性,也就是说模块文件中既包括如何演奏乐器的指令,又保存了声音信号的采样数据。
在实际的使用过程中,MIDI格式文件提取音乐旋律的优点相对其他两种而言要明显得多。在三种音频文件格式中,记录了音乐演奏指令序列的MIDI文件里对于每一个音符的特征都有完全量化的准确描述,播放设备就是根据这些特征来合成回放音乐的,所以从MIDI文件中提取音乐旋律是十分精确的。
其次,MIDI文件具有很大的方便性。MIDI文件和模块文件记录了一系列演奏音乐的指令,只要了解了文件的格式,就可以方便地将所需要的旋律特征提取出来。从编程的角度来看,其处理过程并不复杂,只涉及到一些二进制数据的读取、判断和写出。MIDI文件尺寸相对模块文件要小得多,处理的速度更快,占用系统的资源也更少,是最容易实现的。最后,MIDI文件还具有很好的通用性。MIDI文件通用性很好,适用于各种平台,而且相互之间的转换也不难,有很多专门的音频文件格式转换工具可以使用。MIDI文件显然更合适作为提取音乐旋律的数据源。

4.与旋律特征匹配的检索算法

4.1 单声部旋律的检索算法

用户在使用的过程中任意哼唱起调,每一个单声部音乐最终都转换成一维的字符串,其中每个字符都描述了一个或者一对连续的音符。然后将输入的单声部音乐经转换后得到的查询字符序列和MIDI音乐数据库中的相应旋律所对应的字符序列相匹配。但由于音乐的演奏形式是经常变化的,一些检索系统采用了精确匹配的方法,这时输入的字符串必须是音乐数据库中相应串的子串,在旋律的比较上会产生许多问题。所以在检索中,很重要的一点就是允许模糊检索。

4.2 复调旋律的检索

源于:期刊论文www.udooo.com

算法

复调音乐是两个或两个以上各自具有独立意义的旋律在运动中同时结合在一起的音乐。由于在同一时刻有多个音符,因此相对于单声部音乐,在技术上其旋律特征的分离与提取就变得较为困难,现阶段复调音乐进行处理和检索的方法和技术仍处于初级阶段。

4.3 其他的检索算法

基于“乐纹”的检索算法:“乐纹”是能够代表一段音乐的有效特征序列。用过”乐纹”我们可以将容量很大的音乐用有限长度的字符序列来表示。乐纹的提取过程一般分为预处理、傅立叶变化、帧级特征点的提取、组成特征点对几个阶段。
基于集合的检索算法:这种方法的研究刚刚起步,典型的是Clausen和Kurth将基于集合的方法用于波形数据的检索中,他们使用一种特征提取器将PCM信号转化为集合形式,使之处理起来与音符集合无异。

5.应用及商业价值

有了哼唱旋律的音乐检索方法,人们在KTV点歌的时候就可以不用曲谱,想唱哪首歌曲就点哪首歌曲;电台、电视台制作节目选取背景音乐的时候,就能迅速找到合适的音乐,而无需在大量的音乐资料中每个曲目一一试听、甄别;在知识产权管理中,可以方便审查一首歌曲是否有抄袭侵权行为;两亿多的网民就可以哼唱点歌,随心所欲搜索自己喜欢的音乐;电信运营商可以为广大手机用户提供更为优质的写作铃声增值怎么写作等。作为一种重要的媒体资源,哼唱旋律的音乐检索对于音乐数据库和数字图书馆建设也有着非常重要的意义。构建完善的哼唱旋律的检索方法,不仅是一种有效的资源组织方式,更是在很多领域有着广泛的应用前景,不但能推动音乐院校检索科研的开展,而且能推动广播电视数字化和电信业务的蓬勃发展。
哼唱旋律的检索方法,比过去只提供文本检索,在不知道曲目的文字标注信息下,就用旋律的片段来完成音乐检索,找到自己的所需,这是此项研究最大的创新所在。此项研究应用前景广泛,不管是在人们的学习工作当中,还是在日常生活娱乐当中,都有着广阔的市场空间以及巨大的商业利润。
参考文献:
A.Ghias,J.Logan,D.Chambetlain,B.C.Smith.“Query by Humming-Musical Information.Retrieval in an Audio Database”.ACM Multimedia,San FranciSCO.1995.
Roger J.McNab,Lloyd A.Smith,Melody Transcription for Interactive Applicationst Department of Computer Science,University of Waikato,New Zealand.
[3]金毅,凌建平.站点建设有问必答——我要上网[M].上海交通大学出版社,2000.
[4][英]RUSS,M.著.夏田译.声音合成与采用技术(第三版)[M].人民邮电出版社,2011,1.

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号