流媒体和音视频数据读取在互联网上的实现_音频编码论文

流媒体与声像资料网上阅览的实现,本文主要内容关键词为:声像论文,流媒体论文,资料论文,网上论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号] TP37

1 前 言

现代信息技术的发展,使越来越多的非印刷型资料进入了图书馆,录音带、录像带、CD光盘、VCD影碟、LD影碟、DVD影碟等声像资料占了较大的一部分,这部分资料我们称为非书资料。与书刊相比,声像资料能充分调动读者的视觉和听觉器官,给读者真实生动的感官刺激,加深信息的获取,因此很受读者的欢迎。声像资料由于其信息载体的原因,比印刷型图书更易损坏,光盘资料甚至数据面划伤一点都会造成整张光盘的报废。我馆以前一直对声像资料提供出借服务,但在实际工作中发现,资料的损坏情况比较严重,不得以只好取消出借服务,读者获取声像资料只有通过复制和在视听部在室阅览的方式,给读者增加了不便,也加大了我们的工作量。为了解决这个问题,我馆在1998年开始进行声像资料的数字化转换工作,目的一是为了方便资料的保存,二是便于对外服务,主要是处理录音带、录像带和CD,我们把馆藏语音资料转换为MP3格式,录像资料转换为MPEG—1格式,设立了对外服务器,利用Web技术在校园网内提供阅览服务,受到师生的热烈欢迎。由于数字化后的声像资料采用HTTP协议提供服务,读者访问采用下载方式阅览,服务器对用户的访问没有太多的管理和限制,带宽的消耗非常大,像MPEG—1文件点播时竟占用1.5Mb的带宽,不但服务器资源的利用率不高,而且还造成服务器的堵塞。如何解决这个问题呢?互联网的飞速发展和流媒体技术的兴起为我们找到了出路。

2 流媒体技术介绍

2.1 什么是流媒体

目前,在网络上传输音视频等多媒体信息主要有下载和流式传输两种方案。当用户通过TCP/IP协议下载文件时,服务器会按照一定的次序将文件分成若干个独立的数据包,然后依次发送出去。而客户端的程序会将这些数据包重新组装起来,最终形成和原来完全一样的完整的文件。这时候,就可以对这个文件进行任何可能的操作了。因为A/V文件一般都较大,所以用户需要的存储容量也较大;同时由于网络带宽的限制,下载常常要花数分钟甚至数小时,所以这种处理方法延迟也很大。而流式传输在播放前并不下载整个文件,只将开始部分内容存入内存,音视频等时基媒体由音视频服务器向用户计算机进行连续、实时传送,客户只需经过几秒或十数秒的启动延时即可进行观看。当音视频时基媒体在客户机上播放时,文件的剩余部分将在后台从服务器内继续下载,就向流水一样流进客户的电脑。流式不仅使启动延时成十倍、百倍地缩短,而且不需要太大的缓存容量。流式传输避免了客户必须等待整个文件全部从服务器上下载才能观看的缺点。这种在Internet中使用流式传输技术的连续时基媒体,如:音频、视频或多媒体文件,就叫做流媒体(Streaming Media)。

流媒体技术是为了解决Internet中低带宽网络上音视频信息传输问题而产生和发展起来的一种网络新技术,采用流媒体技术,能够有效地突破低比特率接入Internet方式下的带宽瓶颈,克服文件下载传输方式的不足,实现多媒体信息在Internet上的顺畅传输。流媒体技术自它诞生起,就被广泛应用于互联网多媒体新闻发布、在线直播、网络广告、电子商务、视频点播、远程教育、远程医疗、网络电台、实时视频会议等互联网的信息服务的方方面面。流媒体有非常巨大的市场潜力;在美国已经有三份之一的互联网用户使用流媒体业务,有近百家的ISP提供流媒体业务。在2000年已有40亿左右的市场;在欧洲、亚洲等地这样的用户也有一定的规模。有专家预测;网络流式媒体应用在美国2004年将达到210亿美金的市场规模,比起1999年成长超过两倍。

在我国,受网络的发展状况及其带宽的影响,流媒体的应用不如国外,但是,基于局域网的应用却是一个热门话题,局域网拥有较高的带宽和有限的用户,非常适合流媒体的传输。现在,许多高校都架设了校园网,它是基于局域网技术的宽带网,有开展流媒体服务的良好基础。图书馆内部网作为校园网的一部分,同样享受宽带的优势,在网上开展声像资料的流媒体服务,能有效解决图书馆声像资料的利用问题,具有很好的效益。我馆开展的网上声像资料的流媒体服务就取得了很好的效果,达到了预期的目的。

2 流媒体的种类和特点

流媒体领域的巨大市场前景,使得众多厂商倾力投入其中,现在提供流媒体音视频服务的平台很多,RealNetworks公司的RealSystem、微软公司的WinwdowS Media、苹果公司的QuickTime、IBM公司的VideoCharger、Oracle公司的OVS、CiSCO公司的IP/TV、SGI公司的Kasenna MediaBase、Sun公司的Sun StorEdge。最常用的系统有RealNetWorks公司的RealSystem,微软公司的WindowsMedia和苹果公司的QuickTime。

RealNetworks公司是世界领先的网上流式音视频解决方案的提供者,提供从制作端、服务器端到客户端的所有产品。它的客户端播放器Realplayer的全球注册人数已经超过了一亿六千万人。RealNetworks公司最新的网上流式音视频解决方案叫RealSystemIQ,RealSystem IQ容易安装,在高低带宽均可提供良好的音视频质量,但价格较贵,而且升级服务费用也高,作为流媒体领域的主导厂商,RealNetworks公司凭借其优秀的技术,占领了一多半的网上流式音视频点播市场。

Apple公司的QuickTime是Apple公司面向专业视频编辑、Web网站创建和CD—ROM内容制作领域开发的多媒体技术平台,QuickTime支持几乎所有主流的个人计算机平台,是数字媒体领域事实上的工业标准,是创建3D动画、实时效果、虚拟现实、A/V和其它数字流媒体的重要基础。QuickTime4是苹果公司最新的流视频平台,对于使用Mac OS的用户来说是一个比较理想的流视频方案选择。目前QuickTime4播放器已经在全世界被众多的Mac及视窗用户所采用,是仅次于RealPlayer、Windows Media Player的流视频插放器。QuickTime的一个显著特点是支持转播功能和模块化API,用户可以方便地通过QTSS API为服务器添加新的功能。

Microsoft Windows Media技术是一个能适应多种网络带宽条件的流式多媒体信息的发布平台,Windows Media Service是Microsoft提出的流信息播放方案,其主要目的是在Internet和Intranet上实现包括音视频信息在内的多媒体流信息的传输。微软公司推出的Windows Media技术以其方便性、先进性、集成性、低费用等特点,逐渐被人们所认识。Windows Media的前身是微软公司的Netshow产品,随着流媒体的广泛应用,推出了流媒体制作、发布、播放和管理的一整套解决方案。其服务器端的Windows Media Server产品集成在Windows 2000 Server中。Windows Media产品的一大特点是其制作、发布和播放软件与Windows NT/2000/9x集成在一起,不需要额外购买。微软的流视频解决方案制作端与播放器的视音频质量都上佳,而且易于使用,虽然在整体解决方案方面和RealNetwork的产品相比还有差距,但随着微软在这方面投入的加大,这个差距正在不断缩小。

Micrososft最新的流媒体文件格式是Windows Media Audio and Video 8,与上一版本WMV7相比有几个新特征:

(1)压缩编码后的文件格式进行更改:音频为WMA,视频为WMV,与过去的asf文件相比,类型更加清楚,可直接根据文件的后缀名知道是声音还是图像文件。

(2)图像质量得到更大提高:在250Kbps的速率下实现了接近高清晰录像带的画质(320x240,24帧/秒);500Kbps的速率下实现了接近DVD的画质(640x480,24帧/秒)。

(3)支持“True”VBR(Variable Bit Rate,即可变速率编码),为电影下载观看做了最大优化。

(4)压缩率提高了30%,节省节目存储空间。

现在国内高校图书馆服务器普遍使用的是Windows操作系统,它有使用操作和维护简单的优点,而且Windows Media在微软视窗平台上是免费的,加上声像资料的服务只限于校园内,不像收费网站服务面那么广,从节省资源的角度出发,采用微软的流媒体解决方案是个不错的选择。

3 Windows流媒体系统的组建

Windows流媒体系统包括编码平台和服务器平台两部分,编码平台负责捕捉,压缩实时的或已被存储的音视频内容,并把它格式化为Advanced Streaming Format(ASF),编码成功的ASF内容送到服务器。服务器平台负责存储已编码的音视频内容,并对客户的点播请求进行处理后,发送ASF流,实现在线实时点播。下面从软硬件配置、流媒体制作、流媒体发布几个方面进行说明。

3.1 Windows Media流媒体系统的软硬件配置

硬件:工作站电脑 二台PⅢ600,20G IDE硬盘,D—Link DEF— 530TX网卡,创新SB Live 数码版 声卡 DVD光驱

服务器电脑 PⅢ800,8个36G SCSI硬盘,3COM 980—TX网卡

WINNOV Videum[TM]AV视频捕获卡

录音卡座

录像机

LD播放机

VCD播放机

DVD播放机

软件:Windows Media Encoder 7.1中文版(进行声像资料的压缩编码用)

VCDGear 2.0(用于VCD的dat文件转换成编码软件可识别的MPEG—1文件)

DVD2AVI 1.76(用于DVD中的vob文件转换成编码软件可识别的AVI文件)

工作站安装Windows 98二版操作系统,Windows Media Encoder 7.1中文版、VCDGear 2.0、DVD2AVI 1.76应用软件,Windows Media Player升级到7.01版,其中一台安装WINNOV Videum[TM]AV视频捕获卡。采用PⅢ600是因为Windows Media的软件编码过程对CPU的资源的占用较高,采用高配置有利于提高工作效率,当然,PⅢ档次的电脑也能完成工作,不过速度就要慢很多了。服务器安装windows 2000 Sever版。

3.2 Windows Media流媒体的制作

视听资料有录音带、录像带、CD光盘,VCD影碟、LD影碟、DVD影碟等种类,制作可分为软件制作和硬件制作两种方式。所谓的软件制作和硬件制作并不是严格意义上的划分,因为所有的处理都离不开电脑,电脑本身就是属于硬件,所谓的软件制作是指只通过基本设备电脑就能完成制作过程,而硬件制作需要借助其它硬件才能完成制作过程。

软件编码就是不使附加硬件,将视听资料通过软件转换和处理生成流媒体文件,CD光盘、VCD影碟、DVD影碟可以进行软件编码,软件编码的方式较复杂,因资料的不同而有所差异,分别如下:

①CD光盘打开Windows Media Player程序,选择CD音频,CD光盘中的相关信息会在右边的菜单中显示出来,选择菜单上的复制音乐按钮就可把自动将CD中的音乐压缩到C:\My Documents\My Music中(这个目录可在“工具菜单---选项”中更改),对于CD中信息不能显示的光盘,可在菜单上手动修改资料。Windows Media Player缺省是以64Kbps的标准来压缩,这种质量的声音已经基本达到CD的音质,如需要更好的质量,可选择工具菜单--选项---CD音频中的复制设置中进行更改。另外,也可用Windows Media Encoder来进行制作,不同之处在于用Windows Media Player制作是快速的制作,十分钟的内容只要二分钟就能处理完,且每个歌曲能自动存储;而Windows Media Encoder是1:1的制作,且所有内容存成一个文件。建议采取Windows Media Player来制作。

②VCD影碟先用VCDGear 2.0软件将VCD中的dat文件转化为MPEG—1文件格式,储存在硬盘上,再用Windows Media Encoder将MPEG—1文件编码成流媒体格式。

③DVD影碟先用DVD2AVI 1.76软件将DVD中的vob文件转化为AVI文件格式,再用Windows Media Encoder将AVI文件编码成流媒体格式。

硬件制作就是将视听资料通过相应的播放设备连接到电脑的视频捕获卡或声卡上,设置好流的大小后,进行硬件压缩编码,生成流媒体文件。

制作好的流媒体文件通过网络传到服务器上。

软件制作和硬件制作的比较:

(1)所有的视听资料都可通过硬件制作的方式来处理;软件制作只能处理电脑存储设备所支持的媒体类型,现在的电脑外部存储器一股有CD—ROM或DVD—ROM驱动器,因此能处理的资料有CD、VCD、DVD等。

(2)硬件制作需要额外的附加设备,而软件制作则不需要,因而可节省投资且使用方便;

(3)硬件制作是资料源播放时间和处理时间1:1的制作过程,制作周期短,效率高;软件制作不是1:1的过程,它根据电脑的配置、资料的种类、所设置流大小的不同而有所不同,几种资料中,CD的处理速度最快,而VCD、DVD等视频资料的编码速度较慢,往往是源带播放时间的几倍。

(4)硬件制作出来的资料质量不如软件制作。由于软件制作是在电脑的内部进行,数据的传输和处理都数字化,因此资料在编码前几乎没有损失;而硬件制作资料由播放设备到采集设备有线路损失,采集卡采集时也有损失。

3.3 Windows Media流媒体的发布

流媒体的发布方式包括点播、广播和组播:

点播是客户端与服务器之间的主动的连接。在点播连接中,用户通过选择内容项目来初始化客户端连接。用户可以开始、停止、后退、快进或暂停流。点播连接提供了对流的最大控制,由于每个客户端与媒体服务器之间都需要建立一个单独的数据通道,这种方式会迅速用完网络带宽。

广播指的是用户被动接收流。在广播过程中,客户端接收流,但不能控制流。例如,用户不能暂停、快进或后退该流。广播方式中数据包的单独一个拷贝将发送给网络上的所有用户,这种传输方式非常浪费网络带宽。实时的多媒体内容最适合使用广播服务方式。

组播吸收了上述两种发送方式的长处,克服了上述两种发送方式的弱点,将数据包的单独一个拷贝发送给需要的那些客户。组播不会复制数据包的多个拷贝传输到网络上,也不会将数据包发送给不需要它的那些客户,保证了网络上多媒体应用占用网络的最小带宽。

在进行网上音视频资料的服务时,为了便于读者的使用和控制,可采用点播的方式。设置服务器点播点的方法比较简单,简述如下:

(1)运行服务器管理工具中的Windows Media,选择新建一个点播发布点;

(2)设置发布点的别名和路径,别名是管理员对存放点播资料目录所取的名字,如音乐资料可取名为music,路径是该资料目录在服务器上的物理位置;

(3)选择传输协议,建议用MMS,设置好服务器的IP地址。

(4)根据网络情况和资料编码流的大小设置用户数量和连接的带宽。现在,就可以开始提供服务了。视听资料的制作和发布流程图见图1。

图1 视听资料制作和发布流程图

3.4 对建立Windows流媒体系统的一些说明

①设计好流式系统:为了确保得到高质量的节目,必须以高比特率和高帧数设计流式系统,音像资料的编码,解码,存储会给整个系统的组件带来了沉重的负担。这个负担并不是均匀分布于整个系统的,而是主要集中在编码平台上,工作站的配置决定了编码的质量和效率,因此尽可能选择高配置。接下来是客户端计算机,它要解压缩和显示更多的数据。对服务器平台的影响是最小的,因为从服务器的角度来看,处理高数据率和处理低数据率没有什么区别,从性能的角度来看,处理高数据率只不过是需要更多的CPU周期。服务器平台的配置要求依赖于内容是被实时流化还是有需要时才演化而不同。如果服务器平台要流化点播内容,就必须要有一个高性能的磁盘子系统。当流化实时内容时,磁盘子系统的性能就不是很重要了。一般来说一个服务器能流化大约50到70Mbps(通过一个100MB的网卡)。如果要超过这一限制,你必须使用一组服务器并带有某种负载均衡软件。

②采用高质量和高性能的视频捕捉卡和声卡:推荐使用一个基于PCI的捕捉卡,因为无论多少个CPU时钟周期都不能补偿基于ISA的设备的慢特性。工作站在编码时,CPU的开销是非常大的,如果一块捕获卡没有强劲的处理能力,必然需要占用CPU的资源,加大系统的负担,造成编码时的图像掉帧。低价位的捕捉卡只能得到低分辩率的图像和较差的质量,如:WINNOV Videum?AV只能不掉帧捕获320x240分辨率的视频,有条件的用户建议采用高端Osprey 500 WM/DV捕捉卡。如果不在乎制作的时间,建议光盘类的声像资料采取软件制作的方式,这样能得到最好的编码质量。

尽管声卡的效率已经不是一个问题(基于ISA和PCI的设备都能工作得很好)。但在系统中组件质量的好坏将会导致最后结果的巨大差别。价格便宜的音频设备往往在高采样率下效果很差,而且使音频和视频不能同步。特别是正经过较长的时间间隔后。千万不要使用固化到母板上的廉价音频设备。鉴于声卡的价格比较便宜,强烈推荐购买一个高端产品,例如,创新的SoundBlaster AWE64 Gold、SB Live或SB Audigy.

③编码平台的能力:在工作站开始编码时,先测试CPU的能力,运行编码器为一段高速动作图像编码。如果帧数能保持一致并超过25帧/秒,那么系统已经足够快来完成这一工作。在编码时要避免为流的音频部分选择太高的高比特率,因为这会增加系统的编码和解码需求。有时音频数据率设置得太高会导致音频和视频的不同步,终止编码并打开设置的属性页,将音频数据率改为一个较低的设置。

④为声像资料设定大小合适的流:为了得到高质量的流媒体,必须在编码时选择高比特率和高帧数,但比特率到了一定的时候,再增加也没有明显的变化,而对于录像带这种源信号不好的资料,选择高比特率的流没有任何意义,所以要针对不同的资料选择合适的比特率。一般来说,录音带可选择64Kbps,CD选择96Kbps,录像带选择250KbPs,VCD选择350Kbps,DVD选择500Kbps。

⑤保证源信号的质量:在源信号传输和处理过程中必须小心以保证内容被无缺陷地录制和压缩。一个普遍的错误概念是认为压缩能掩盖原始材料中的缺陷。实际上,事实与此相反.压缩处理会放大任何可见的非自然信号或包含在原始视频中的噪声。

4 我馆开展网上流媒体服务的总结

鉴于HTTP服务的众多弊端,我馆改用流媒体方式提供声像资料的网上阅览服务,更改其实很简单:对于已经压缩成MP3格试的音频内容,由于Window Media Sever提供对MP3格式的流式服务支持,因此只要在访问的web页面中将访问协议由HTTP改为MMS就可以了,如:MMS://stb.lib.szu.edu.cn/audio/dxyyjd/01.mp3;对于MPEG—1格式的视频资料,直接用Windows Media Encoder进行编码后,在访问的Web页面中将访问协议由HTTP改为MMS。

改用流式服务后,读者不能下载声像资料,只能在线使用,这虽然给读者增加了少许的不便,但减轻了服务器的压力,保证了服务器的正常运行,提高了服务质量,这其实给读者带来了更多的方便。采用流式服务还有效地保护了我馆的数字化资源。

至今,我馆已经有2000余盒语言教学录音带,400盒CD,200多部录象教学片,100部文艺故事片的内容在网上提供点播服务,极大地方便了读者的学习和娱乐,减轻了对外服务工作的压力,减少了资料的损坏,读者对我们的工作给予了很高的评价。随着我馆数字化工作的继续,将实现所有馆藏声像资料的网上阅览。

标签:;  ;  ;  ;  ;  ;  ;  ;  

流媒体和音视频数据读取在互联网上的实现_音频编码论文
下载Doc文档

猜你喜欢