原创 【转贴】Mp4的数据编码答疑

2007-8-31 21:10 3452 2 2 分类: 汽车电子
1) 什么是MP4?听闻它是一种“容器格式”,那是什么?
容器格式允许你将不同种类的多媒体数据流(多为视频流和音频流)合并在一个单一的文件内。
多媒体容器格式,就是我们熟知的AVI(.avi), MPEG(.mpg, .mpeg), Matroska(.mkv, .mka), OGM(.ogm), Quicktime(.mov),或Realmedia(.rm, .rmvb)。

MP4是遵循MPEG-4(ISO 14496-14)的官方容器格式定义的广义文件扩展名。它可以流媒体化并支持众多多媒体的内容(多音轨(multiple audio)、视频流(video)、字幕(subtitlestreams)、图片(pictures)、可变桢率(variable-framerates)、码率(bitrates)、采样率(samplerates)等)和高级内容(advanced content)(官方称之为“Richmedia”(超媒体)或“BIFS”(Binary Format for Scenes)(二进制格式场景)),类似2D和3D图形,动画、用户界面、类DVD菜单,上述这些AVI搞不定的东西。

2) MP4文件的扩展名用什么?
-.mp4:唯一的官方扩展名,支持所有音频和视频(以及高级内容) 。
-.m4a:由Apple公司提出的以支持aac/alac纯音频文件,m4a扩展名可以安全地更名为mp4。

其他相关的扩展名:
-.m4p:随iTunes发售的DRM(Digital Rights Management)(数字版权保护技术)产权保护的文件,使用Apple开发的DRM sheme。
-.m4e:由.sdp修改扩展名的来的文件,Envivio用其于流媒体播放。
-.m4v, -.mp4v, -.cmp, -.divx, .-xvid:纯视频,raw的mpeg-4视频流(并非内含于mp4)。
-.3gp, -.3g2:手机中使用的格式,其中储存的内容同样在.mp4未被定义(H.263, AMR(Adaptive Multi Rate)(自适应多码率))。

 

3) 如何创建标准的MP4文件?
简单的回答:参考doom9的MP4指南NERO Recode2指南

详细解答:
1) 为了制作MP4文件,你应该优先使用MPEG-4标准下的音频/视频格式:
- MP4视频格式包括:MPEG-4 SP(Simple Profile)(简单类)/ASP(Advanced Simple Profile)(高级简单类):xvid, divx5, 3ivx,ffmpeg/ffdshow, NeroDigital ASP...及MPEG-4 AVC/H.264x264, NeroDigital AVC, Apple...还有MPEG-2,MPEG-1(不含Divx3/M$ MPEG4, WM9, RV9或VP6)。-doom9的质量比较测评:1 2
- MP4音频格式包括:Advanced Audio Coding(AAC FAQ):Quicktime/iTunes, Nero, Psytel, FAACbinary)...(rjamorim的质量比较测评:1 2)和mp3, mp2, mp1, celp(语音), TwinVQ(非常低的码率), SAOL(midi), ALS(无损)。
- MP4字幕/文本格式:MPEG-4时标文本(见Q7)。
- MP4图片格式:JPEG, PNG
2) 使用下列的软件可以将遵循MPEG-4的内容Mux进MP4容器。
- GPAC的MP4box,命令行界面,支持AVC(Advanced Video Coding)(高级视频编码),packed B-frames(打包B桢),高级内容/BIFS,TTXT和章节。
- MPEG4IP的mp4creator,命令行界面,能够mux AVC,但不要用于AVI及(packed) B-frames!
- 3ivx mp4 muxer,dshow滤镜,可以在GraphEdit中使用,支持使用packed B-frames的avi,但不支持AVC(3ivx 指南)。
- mp4UI,操作简单,软件基于MPEG4IP,不支持AVC,AVI及(packed) B-frames!(doom9指南
- VideoLAN Client,支持AVC,不能用于packed B-frames。
- ffmpeg,问题多,命令行界面,尤其不能用于AVC,AVI及(packed) B-frames!
- IBM的Toolkit for MPEG-4,含基于Java的XMTBatch和/或AVGen(也是一个简易的版本)
- dvd2mp4GUI,mp4tool的GUI,可以简单的将多音轨及字幕(作为高级内容)mux进MP4。
- mp4tool/mp4edit,来自于ENST,类似于mp4box。mp4edit是mp4tool命令行软件的简易GUI版本。

3) 下面有一些“all-in-one”的MP4编码工具。
- Nero Recode2,使用ASP、AVC或AAC来编码MP4(doom9指南),subs是dvd的vob subs(图形字幕),包含dshow muxer。
- Doom9的MeGUI,支持ASP(xvid, libavcodec), AVC(xvid),和AAC(Besweet - Nero)编码。
- HDX4支持ASP和AAC。
- Dicas的mpegable X4 live,操作简单,用dicas的MPEG-4的codec直接编码mp4。
- Envivio的4coder支持MPEG-4 AAC, ASP/SP和AVC。

4) 以下工具可用来编辑MP4文件(如分割、追加合并):
- MP4Box可以按照时间和尺寸分割MP4(AAC, ASP, AVC, TTXT, MPEG-1/2, 专用媒体流),提取部分及合并mp4。
- ulead的VideoStudio 8+ MPEG-4插件
- Quicktime/Pro能够创建(编码,mux)和编辑(分割、合并)mp4文件,支持MPEG-4 Simple Profile, AAC, AVC。
4) 有没有可能将非MPEG-4标准的数据流放进MP4?
可以,虽然我不认为这是个好主意。MPEG-4标准定义了如何将数据流放入MP4的方式。类似于AVI,数据流根据专用的FourCCs方式被放入AVI中;在MP4中,每一个数据流有一个“专用的轨道ID(private track ID)”。记住,没有一个播放器能够支持MP4中此类的数据流,只会简单地把它们忽略。除非你非常明确地要这样做。
以下的数据流,不遵循MPEG-4标准,但已经能够被放入MP4中了。
- Ogg Vorbis和Ogg Theora,使用MP4Box。
- Ogg Vorbis,使用修订版的mp4creator
- Apple 的无损音频(ALAC/ALE - 不兼容MPEG-4 ALS),使用iTunes
- DVD图形字幕(Vobsubs),使用Nero Recode2
- AMR语音,使用NEC e808/e616手机。
唯有等到了将来,我们才能知道此类的非公开数据流能否被广泛的接受和支持。。。

5) 当我从avi中将MPEG-4视频Mux进MP4时,有哪些事项是必须特别注意的?
在做AVIs Mux至MP4处理时,有一些潜在的问题。特别是编码中使用了B桢(b-frames/B-VOPs/bi-directional)。
1)“delay frames(桢延迟)”:由于一些codec(Xvid,Divx5)仍然使用旧的VFW界面会导致此问题。只有当使用VirtualDub/Mod编码且用了B桢时,就会自动丢桢。
2)“packed bitstream(打包的数据流)” :因旧有容器格式AVI不支持储存B桢而产生。在DivX中会用到PB(只有在一个连续B桢的设定情况下),以及新版本的XviD默认设置是使用PB的(处理时要确认PB选项没有被勾选),还有使用其他桢来打包B桢(点击这里了解更多关于B桢的详细介绍)。
3)“ctts”atom(节点):当mux b桢进入MP4中必须写入的信息。
4)“vol(音量)”:在avi的每个关键桢(keyframe)中都要写入,但现在在MP4中已和影片数据分离开了。

现在,只有3ivx mp4 muxer和GPAC的MP4Box可以正确的搞定上述问题。推荐只使用它们进行avi的转换,特别是那些使用packed bitstreams或者那种你不能确定是否使用了b桢设定/编码的avi。否则,你很可能不能够得到100%完全遵循标准的MP4文件!

6) transmux(转换并mux)时是否会对文件内容进行重编码?
不会,这是个无损的处理过程,只是将媒体流从一个容器搬到MP4里。

7) 我怎样才能将字幕mux进MP4?
这里有三种方法可以实现:
- 相对于MPEG-1/2,MPEG-4标准定义有自己的文本流/字幕标准(基于ISO14496-17的MPEG-4的时标文本)。MP4的字幕格式是基于文本的(不是像DVD字幕那种基于图形),遵循UTF-8/16标准(含古斯拉夫语、阿拉伯语、中文字符等)。它支持所有的动态效果(滚动、色彩、卡拉ok效果等),且支持附加字体及流媒体化。
MPEG-4 TTXT的制作,已被MP4box和Quicktime支持。
回放时,可以使用Haali的MP4 dshow Parser, Osmo4, Realplayer和Quicktime(仅当放入.3gp文件中)。同样时VideoLan也支持。
- Nero的Recode2可以用来在MP4中储存专用数据流(Q4),且可以轻易的、不加修改的将DVD中的图形字幕(vobsubs)提出并存入MP4中。
回放此类的媒体流,可以使用Nero的滤镜、Haali的Parser、VideoLan(问题多)和一些硬件支持MP4的DVD播放器。
- 另一个基于MPEG-4标准储存字幕进MP4的方法是将字幕转换为XMT/BT文本格式,然后将它们编码为“高级内容”(BIFS binary格式)存入MP4中。这一方法可适用于任何字幕(使用mp4boxdvd2mp4gui,例如转换SRT字幕)。
回放这些高级内容,你需要可以支持此类内容的滤镜/播放器(见Q12)。

8) 我如何将章节放入MP4文件中?
章节的存储也可以使用高级内容实现(例如创建一个目录菜单),但Nero使用了另一个方法。它使用了MP4中的一个特性:称为“用户空间”(user space)(udta atom)。它允许在MP4中附加任何你想的东西。(例如,iTunes使用udta atom在mp4中储存标签和CD/DVD封面(“coverart”))。
你可以使用Nero Recode2在编码mp4过程中自动插入章节信息,或者用MP4Box和record2的MP4 directshow muxer filter在已存在的mp4文件中添加章节信息。(例如在GraohEdit中使用此滤镜)。
关于播放器,如果不能识别在udta中储存的章节信息,则会简单的忽略掉。你需要一个可以搞定此特殊章节信息的播放器或滤镜。(例如,nero或3ivx的dshow滤镜可以支持处理这种atm)。

9) 我如何对MP4文件进行编排创作(例如创建类DVD的菜单)?有没有例子?
基本上编排创作应“手动”编写一个文本的语言格式,称为XMTbt(基于VRML(Virtual Reality Modeling Language)(虚拟现实建模语言),就像我们熟知的Flash),一种能够把它作为binary格式(称为BIFS)编码/编译入mp4(免费的编码器为mp4box, mp4toolXMTBatch)。
现在已经有一些面向MP4编排创作的GUI了,使得这一过程变得很方便。例如IBM, AVIPIX, Envivio, Mindego, iVAST, DigimaxEtri,但都未向大众开放。

所以,如果你想亲自编排创作MP4,除了编辑一个BT/XMT的脚本外没有别的办法。
感谢GPAC的家伙们,现在已经有了关于这个处理方法的指南(英文版法文版),这将对你有不小的帮助。
为了使这个过程更简单,我创作了一个简单的脚本工具,命名为MP4menu,现在已经支持DVD菜单可以提供的所有特性。你可以按照自己的需求使用(指南)。

10) 我如何才能在MP4文件中使用可变形重设尺寸(anamorphic resize)?
MPEG-4标准崇尚“多才能”,能够满足大众的各种需求。它提供了三种可能性:
1) 码流方面:这可能是最具可行性且最大众化的方法。
使用可以设定PAR(pixel aspect ratio)(像素宽高比)的编码(例如3ivx, ffmpeg/ffvfw, xvid)。然后使用任一种MP4的Muxer工具(例如the 3ivx mp4 mixer, mp4box, mp4UI)将得到的AVI Mux至mp4。对于已存在的码流,你可以使用Moitah的MPEG4 Modifier对MPEG-4 ASP进行修改PAR;使用hhanh的ARChange对AVC进行修改PAR。
下列工具可以用来回放可变形resized的文件:VideoLan, Mplayer或者dshow的3ivx, nero或haali parser加上XviD(xvid decode设置AR为auto), 3ivx(打开“force overlay”), Nero或ffdshow(打开“overlay mixer”)解码滤镜。
2) 容器方面:MP4提供了一种“合成矩阵(Composition Matrix)”,能够修改AR、画面旋转、支持多层数据、回放时将两条音轨混音(例:将影片的语音和音乐分离)等功能。
Quicktime/Pro提供了很好的合成方法,通过:Movie -> Get Movie Properties -> Video/Sound Track -> Size/Layer/Volume/... ,还能够正确回放此类经合成编辑的MP4文件。
3) BIFS方面:提供了最广泛的编排创作的可能(Q9),同样还能够修改AR(例:通过改变2d缩放(Transform2D.scale))。你可以使用GPAC的工程软件:MP4box和Osmo4来创建和回放此类BIFS控制的数据流。

11) 有没有可能在MP4中创建VFR(Variable Framerate)(可变帧率)内容?
可以。察看下面的帖子

12) 我如何播放MP4文件?
由于MP4的互用性这一巨大优势及开源标准(授权免费!)这些特性,现在已有众多工具可以在不同系统包括Mac, Linux, PocketPC当然还有windows中支持MP4。

1) 如果你想用基于dshow的播放器(例如media player classic, bsplayer, zoomplayer或者蹩脚的windows media player)来回放任何此类的媒体文件,首先你需要用到下面两个东西:
-- 一个分离滤镜(splitter/parser filter):它能够在回放时将容器中包含的数据流(音频流、视频流、字幕流)分离开。
-- 一个解码滤镜(decode filter):它(例如:ffdshow, 3ivx, CoreAAC)能够将编码的数据流解码。
顺便说一下,我们在播放AVI时不需要安装分离滤镜的唯一原因是windows系统已经默认安装了这个东西。

这里有一些组件包,包含了这些滤镜:
-- Haali的Media Splitter支持MP4中的AAC, ASP, AVC, MPEG-1/2音频(例:mp2/mp3)和视频,TTXT,vobsubs和章节,并支持地切换音频、视频、字幕,是无限制的,部分开源的,免费的。
-- 3ivx也是可用的,类似Haali的 Splitter,是一个像ffdshowCoreAAC那样有可选择性的解码器。确定3ivx splitter中的“allow unsupport decoders(允许未支持解码器)”选项已勾选。3ivx支持MP4中的MP2, MP3, AAC, ASP, 章节,但不支持AVC!
-- moonlight提供了支持MP3, AAC, ASP, AVC的MP4 splitter,并附带ASP/AVC解码器。
-- Nero Vision Express支持AAC, ASP, AVC, vobsubs和章节(字幕/章节/多音轨仅Nero Showtime支持!)。
-- HDX4支持MP4中的AAC和ASP。
-- EnvivioTV支持MP4中的高级内容/bifs(样本), AAC, ASP和AVC。
-- Dicas的mpegable支持RTP(Real-Time Transport Protocol)(实时传输协议)流媒体,AAC, ASP和AMR(.3gp音频)的解码。
-- Ligos的LSX-MPEG,仅支持Simple Profile视频,30天预览版本。

2) 如果你不能/不想使用基于windows dshow的播放器,你也可以使用下列的播放器来播放MP4:
-- Apple的Quicktime被广泛使用,支持MPEG-4 SP, AVC和AAC
-- Realnetworks的RealPlayer10支持MPEG-4 SP + b桢(仅plus版本)和AAC。
-- GPAC的Osmo4,开源(GPL),支持BIFS(字幕,用户互动,类dvd目录...)和TTXT。
-- MPlayer,开源(GPL),支持ASP和AVC,支持众多系统,象Win, Linux, Mac OS...
-- Videolan,开源(GPL),支持ASP和AVC,多系统支持。
-- MPEG4IP的WMP4Player,开源(LGPL(Lesser General Public
License)(GNU较宽松公共许可证)/MPL(Mozilla Public License)),支持ASP和AVC。
-- xine,开源(GPL),多系统支持。
-- Philips的Platform4 Player支持PocketPC。
-- ENST的Osmo4(基于参考源),支持高级内容/BIFS。
-- IBM的M4Play含Toolkit for MPEG-4,基于Java,支持高级内容/BIFS。

3) 硬件/独立播放器:由于最流行的MPEG-4 ASP执行者(DivX5/XviD)经常被放入AVI中,那也成为了现在播放器最广泛支持的格式。同样是nero的那些家伙,也是为了满足消费者日益增长的需求,他们尝试将MP4容器格式能够被硬件播放器支持,并逐步取得了成功:
最初支持MP4(仅ASP视频格式,非AVC)的硬件播放器如下:
-- Kiss的DP-558支持AAC, ASP(不支持QPel(Quarter-Pixel)(1/4象素预测)/GMC(Global Motion Compensation)(全域动态补偿)),支持VobSubs和章节(Sigma Designs的EM8560)。
-- Siemssen的SCO 5000ND支持AAC(不支持MP3/MP2),ASP(QPel/1WP GMC),VobSubs和章节(Zoran Vaddis 776)。
-- RJTech的RJ 1500DVX II支持AAC(5.1), MP3, ASP (QPel/1WP GMC/CQM), VobSubs, 章节(ESS Vibratto-II)。
-- Xoro的HSD 415/310播放器支持AAC, ASP(不支持QPel/1WP GMC?), VobSubs, 章节(ESS Vibratto-II)。
-- Tevion DR 2004,支持AAC, ASP(不支持QPel/1WP GMC?)和VobSubs。
-- Tevion DVD-4000, 最新的firmware(固件)支持ASP(不支持QPel/1WP GMC?)和MP3(不支持AAC)(ESS Vibratto-II)。
-- Philips的DVP630/632/642播放器支持ASP(不支持QPel/1WP GMC?)和MP3(不支持AAC)(ESS Vibratto-II)。
-- M$的XboxXbox Media Center支持MP2, MP3, AAC和AVC。
-- Sony的Playstation Portable(PSP)支持AAC,SP(sony记忆棒(Memory Stick)中)和AVC(UMD(Universal Media Discs)(环球媒体光碟)中)。注意PSP的UMD使用自己的文件格式(类似MPEG PS,带Atrac3音频,并非AAC),当然通过最新的固件(firmware)可以从记忆棒中播放AVC,虽然是有严格限制的320x240但可选择16:9的比率。
-- Apple的iPod支持AAC(不支持视频)。
-- Sigma Designs的Xcard支持在PC上硬体解码MPEG-4包括MP4容器。

13) 如何直播/收看实时(live-)的MP4流媒体?
Apple和MPEG4IP提供了不错的、免费的工具以将MP4流媒体化:
想要做流媒体服务器,你可以使用Apple的Darwin Streaming Server,这是everwikedlinuxjornal里提供的操作指南。
要直播流媒体你可以使用MPEG4IP的mp4live(仅Linux支持),这是everwikedMPEG4IP的指南。在Windows系统中,你可以使用MPEGRecorder(看上去像mp4live的一个端口)。
同样,你可以看一下ViTooKi的工具包(开源的流媒体服务器、播放器和其他相关工具)。
另一个免费、开源的mp4流媒体服务器是Cata提供的。
如果是MAC系统,你可以看一下Live Channel

要播放广播/直播式的流媒体,你可以用Apple的Quicktime, Real的RealPlayer 10, MPEG4IP的WMP4Player, Dica的mpegable和EnvivioTV(都运作在dshow播放器下)和GPAC的Osmo4(最后两个也可以支持高级内容/用户互动)。

流媒体样本:1 2

14) 那里可以找到mp4码率计算工具?为什么由源AVI制作得到的MP4文件体积要比源AVI文件体积小一点?
MP4需要的overhead的容量远小于AVI容器(特别是VBR-mp3音轨)。勿需质疑,与AVI容器相反,MP4容器就是为MPEG-4视频和MP3设计的。
这里有一个计算式,你可以这样说:AVI中的视频流文件体积=最终输出的含视频音频的MP4文件体积(像700MB) - MP4的音频体积 + 3MB。
3ivx在它的主页上也提供了一个MP4码率计算工具,但它看上去不是十分精确。

15) MP4支持CRC(Cyclic Redundancy Check)(循环冗余码校验)/EDC(Error Detection Code)(错误校验)或ECC(Error Correction Code)(自纠错)吗?
不支持。MP4容器本身,乃至MPEG-4标准都不希望支持码流中的错误检测/纠正(Error Detection/Correction)(它们该用在该用的地方)。
点击这里,了解更多有关MPEG-4码流中的错误自适应(Error Resilience)。

16) 有没有可能得知一个MP4文件是用何种编码创建的?
是的。对于MPEG-4 ASP的视频流和MP3音频流(现在还没有一个真正的方法来确认是否用了AAC音频编码)来说,是可以的。
点击这里,了解更多。

17) MP4是MP3的继承者吗?
是,也不是。说它不是,因为MP3是一种特别的音频格式,而MP4是一种容器格式并非是音频编码。说它是的,因为MP4是MPEG-4标准的一部分,MPEG-4标准是MPEG-1/2的继承者,而mp3亦是它的一部分。
MPEG-4还包括AAC,一种比MP3更好的音频编码,也被用于MP4中。

18) MP4和MOV/3GP是一样的吗?
Apple的MOV容器格式确实与MP4的出发点相同(主要在moov atom方面),但它们之间还是有不少区别的。
从另一方面来说,MP4的出发点是3GP格式(通常用于手机中)的开发。3GP格式普遍用于MP4中,就像用于MOV中一样。然而,这仍是另一种格式。

19) 我还想了解更多关于MP4!在哪里能够找到更多信息?
在网络上有不少此类的信息:
首先起点可以是MPEG Industry ForumMotion Picture Experts Group(MPEG)的主页。
有一些关于MP4的好资料:1 2 3
MPEG-4系统标准的草案可以在这里找到。
关于MPEG-4标准MPEG-4系统的FAQs是很有用的,尤其是后者非常有技术价值。
另外可以在audiocoding wiki找到许多信息(也有许多关于AAC的信息)。
关于MP4的创建, 编译成果MPEG4IP有不少指南,同样他们的CVS服务器everwicked.com上也有指南。
PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
2
关闭 站长推荐上一条 /3 下一条