ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）

威哥 2023-03-27 01:23:32 780

ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）fmpeg [[options][`-i' input_file]]... {[options] output_file}... 如果没有输入文件，那么视音频捕捉就会起作用。作为通用的规则，选项一般用于下一个特定的文件。如果你给 –b 64选项，改选会设置下一个视频速率。对于原始输入文件，格式选项可能是需要的。缺省情况下，ffmpeg试图尽可能的无损转换，采用与输入同样的音频视频参数来输出。 3．选项 a) 通用选项 -L license -h 帮助 -fromats 显示可用的格式，编解码的，协议的。。。 -f fmt 强迫采用格式fmt -I filename 输入文件 -y 覆盖输出文件 -t duration 设置纪录时间 hh:mm:ss[.xxx]格式的记录时间也支持 -ss position 搜索到指定的时间 [-]hh:mm:ss[.xxx]的格式也支持 -ti

FFMpeg简介

FFMpeg是当今为的面向音视频开发的开源工程，广泛应用于多种音视频的客户端、播放器和流媒体服务器中。使用FFMpeg提供的工具和SDK，可以完成音视频的编码、解码、转码、封装、解封装、转封装、视频水印和视频缩放等多种需求的开发。

1、ffmpeg使用语法

2、视频转换

3、网络推送

4、视频拼接

5、为视频添加logo

6、抓取视频的一些帧，存为jpeg图片

7、切割ts分片

1、ffmpeg使用语法

fmpeg [[options][`-i' input_file]]... {[options] output_file}... 如果没有输入文件，那么视音频捕捉就会起作用。作为通用的规则，选项一般用于下一个特定的文件。如果你给 –b 64选项，改选会设置下一个视频速率。对于原始输入文件，格式选项可能是需要的。缺省情况下，ffmpeg试图尽可能的无损转换，采用与输入同样的音频视频参数来输出。 3．选项 a) 通用选项 -L license -h 帮助 -fromats 显示可用的格式，编解码的，协议的。。。 -f fmt 强迫采用格式fmt -I filename 输入文件 -y 覆盖输出文件 -t duration 设置纪录时间 hh:mm:ss[.xxx]格式的记录时间也支持 -ss position 搜索到指定的时间 [-]hh:mm:ss[.xxx]的格式也支持 -title string 设置标题 -author string 设置作者 -copyright string 设置版权 -comment string 设置评论 -target type 设置目标文件类型(vcd svcd dvd) 所有的格式选项（比特率，编解码以及缓冲区大小）自动设置，只需要输入如下的就可以了： ffmpeg -i myfile.avi -target vcd /tmp/vcd.mpg -hq 激活高质量设置 -itsoffset offset 设置以秒为基准的时间偏移，该选项影响所有后面的输入文件。该偏移被加到输入文件的时戳，定义一个正偏移意味着相应的流被延迟了 offset秒。 [-]hh:mm:ss[.xxx]的格式也支持 b) 视频选项 -b bitrate 设置比特率，缺省200kb/s -r fps 设置帧频缺省25 -s size 设置帧大小格式为WXH 缺省160X128.下面的简写也可以直接使用： Sqcif 128X96 qcif 176X144 cif 252X288 4cif 704X576 -aspect aspect 设置横纵比 4:3 16:9 或 1.3333 1.7777 -croptop size 设置顶部切除带大小像素单位 -cropbottom size –cropleft size –cropright size -padtop size 设置顶部补齐的大小像素单位 -padbottom size –padleft size –padright size –padcolor color 设置补齐条颜色(hex 6个16进制的数，红:绿:兰排列，比如 000000代表黑色) -vn 不做视频记录 -bt tolerance 设置视频码率容忍度kbit/s -maxrate bitrate设置最大视频码率容忍度 -minrate bitreate 设置最小视频码率容忍度 -bufsize size 设置码率控制缓冲区大小 -vcodec codec 强制使用codec编解码方式。如果用copy表示原始编解码数据必须被拷贝。 -sameq 使用同样视频质量作为源（VBR） -pass n 选择处理遍数（1或者2）。两遍编码非常有用。第一遍生成统计信息，第二遍生成精确的请求的码率 -passlogfile file 选择两遍的纪录文件名为file c)高级视频选项 -g gop_size 设置图像组大小 -intra 仅适用帧内编码 -qscale q 使用固定的视频量化标度(VBR) -qmin q 最小视频量化标度(VBR) -qmax q 最大视频量化标度(VBR) -qdiff q 量化标度间最大偏差 (VBR) -qblur blur 视频量化标度柔化(VBR) -qcomp compression 视频量化标度压缩(VBR) -rc_init_cplx complexity 一遍编码的初始复杂度 -b_qfactor factor 在p和b帧间的qp因子 -i_qfactor factor 在p和i帧间的qp因子 -b_qoffset offset 在p和b帧间的qp偏差 -i_qoffset offset 在p和i帧间的qp偏差 -rc_eq equation 设置码率控制方程默认tex^qComp -rc_override override 特定间隔下的速率控制重载 -me method 设置运动估计的方法可用方法有 zero phods log x1 epzs(缺省) full -dct_algo algo 设置dct的算法可用的有 0 FF_DCT_AUTO 缺省的DCT 1 FF_DCT_FASTINT 2 FF_DCT_INT 3 FF_DCT_MMX 4 FF_DCT_MLIB 5 FF_DCT_ALTIVEC -idct_algo algo 设置idct算法。可用的有 0 FF_IDCT_AUTO 缺省的IDCT 1 FF_IDCT_INT 2 FF_IDCT_SIMPLE 3 FF_IDCT_SIMPLEMMX 4 FF_IDCT_LIBMPEG2MMX 5 FF_IDCT_PS2 6 FF_IDCT_MLIB 7 FF_IDCT_ARM 8 FF_IDCT_ALTIVEC 9 FF_IDCT_SH4 10 FF_IDCT_SIMPLEARM -er n 设置错误残留为n 1 FF_ER_CAREFULL 缺省 2 FF_ER_COMPLIANT 3 FF_ER_AGGRESSIVE 4 FF_ER_VERY_AGGRESSIVE -ec bit_mask 设置错误掩蔽为bit_mask 该值为如下值的位掩码 1 FF_EC_GUESS_MVS (default=enabled) 2 FF_EC_DEBLOCK (default=enabled) -bf frames 使用frames B 帧，支持mpeg1 mpeg2 mpeg4 -mbd mode 宏块决策 0 FF_MB_DECISION_SIMPLE 使用mb_cmp 1 FF_MB_DECISION_BITS 2 FF_MB_DECISION_RD -4mv 使用4个运动矢量仅用于mpeg4 -part 使用数据划分仅用于mpeg4 -bug param 绕过没有被自动监测到编码器的问题 -strict strictness 跟标准的严格性 -aic 使能高级帧内编码 h263 -umv 使能无限运动矢量 h263 -deinterlace 不采用交织方法 -interlace 强迫交织法编码仅对mpeg2和mpeg4有效。当你的输入是交织的并且你想要保持交织以最小图像损失的时候采用该选项。可选的方法是不交织，但是损失更大 -psnr 计算压缩帧的psnr -vstats 输出视频编码统计到vstats_hhmmss.log -vhook module 插入视频处理模块 module 包括了模块名和参数，用空格分开 D)音频选项 -ab bitrate 设置音频码率 -ar freq 设置音频采样率 -ac channels 设置通道缺省为1 -an 不使能音频纪录 -acodec codec 使用codec编解码 E)音频/视频捕获选项 -vd device 设置视频捕获设备。比如/dev/video0 -vc channel 设置视频捕获通道 DV1394专用 -tvstd standard 设置电视标准 NTSC PAL(SECAM) -dv1394 设置DV1394捕获 -av device 设置音频设备比如/dev/dsp F)高级选项 -map file:stream 设置输入流映射 -debug 打印特定调试信息 -benchmark 为基准测试加入时间 -hex 倾倒每一个输入包 -bitexact 仅使用位精确算法用于编解码测试 -ps size 设置包大小，以bits为单位 -re 以本地帧频读数据，主要用于模拟捕获设备 -loop 循环输入流。只工作于图像流，用于ffserver测试2、视频转换

如何使用 ffmpeg 编码得到高质量的视频

ffmpeg.exe -i "D:\Video\Fearless\Fearless.avi" -target film-dvd -s 720x352 -padtop 64 -padbottom 64 -maxrate 7350000 -b 3700000 -sc_threshold 1000000000 -trellis -cgop -g 12 -bf 2 -qblur 0.3 -qcomp 0.7 -me full -dc 10 -mbd 2 -aspect 16:9 -pass 2 -passlogfile "D:\Video\ffmpegencode" -an -f mpeg2video "D:\Fearless.m2v"

转换指定格式文件到格式

ffmpeg.exe -i test.mp3 -ab 56 -ar 22050 -b 500 -r 15 -s 320x240 f:\test.flv ffmpeg.exe -i test.wmv -ab 56 -ar 22050 -b 500 -r 15 -s 320x240 f:\test.flv

转码解密的VOB

ffmpeg -i snatch_1.vob -f avi -vcodec mpeg4 -b 800 -g 300 -bf 2 -acodec mp3 -ab 128 snatch.avi

上面的命令行将vob的文件成avi文件，mpeg4的视频和mp3的音频。注意命令中使用了B帧，所以mpeg4流是divx5兼容的。GOP大小是300意味着29.97帧频下每10秒就有INTRA帧。该映射在音频语言的DVD转码时候尤其有用。

同时编码到几种格式并且在输入流和输出流之间建立映射

ffmpeg -i /tmp/a.wav -ab 64 /tmp/a.mp2 -ab 128 /tmp/b.mp2 -map 0:0 -map 0:0

上面的命令行转换一个64Kbits 的a.wav到128kbits的a.mp2 ‘-map file:index’在输出流的顺序上定义了哪一路输入流是用于每一个输出流的。

转换文件为3GP格式

ffmpeg -i test.avi -y -b 20 -s sqcif -r 10 -acodec amr_wb -ab 23.85 -ac 1 -ar 16000 test.3gp

注：如果要转换为3GP格式，则ffmpeg在编译时必须加上–enable-amr_nb –enable-amr_wb，详细内容可参考：转换视频为3GPP格式

3、网络推送

创建输出上下文

//创建输出流上下文 AVFormatContext *octx = NULL; re = avformat_alloc_output_context2(&octx 0 "flv" outUrl); if (!octx) { return XError(re); } cout << "octx create success!" << endl;

创建输出流

for (int i = 0; i < ictx->nb_streams; i ) { //创建输出流 AVCodec *codec = avcodec_find_decoder(ictx->streams[i]->codecpar->codec_id); AVStream *out = avformat_new_stream(octx codec); if (!out) { return XError(0); } //复制配置信息同于MP4， //re = avcodec_copy_context(out->codec ictx->streams[i]->codec); re = avcodec_parameters_copy(out->codecpar ictx->streams[i]->codecpar); //out->codec->codec_tag = 0; } av_dump_format(octx 0 outUrl 1);

这里因为avStream结构体中codec已经弃用，但用新版本推送mp4视频的时候会出现不支持，但ffmpeg还是会封装推送，在服务器端支持，并且解析出来，但为了不出现这个错误有2种方案：

1、将推流的mp4文件用 ffmpeg转封装为flv，然后用新版本来实现推流

ffmpeg -i 1080.mp4 test.flv

2、切换到旧版本

这里我用的新版本，推送flv视频

4、视频拼接

比如一个视频的编码是MPEG4，想用H264编码，咋办？ ffmpeg -i input.mp4 -vcodec h264 output.mp4 相反也一样 ffmpeg -i input.mp4 -vcodec mpeg4 output.mp4

当然了，如果ffmpeg当时编译时，添加了外部的x265或者X264，那也可以用外部的编码器来编码。（不知道什么是X265，可以Google一下，简单的说，就是她不包含在ffmpeg的源码里，是独立的一个开源代码，用于编码HEVC，ffmpeg编码时可以调用它。当然了，ffmpeg自己也有编码器） ffmpeg -i input.mp4 -c:v libx265 output.mp4 ffmpeg -i input.mp4 -c:v libx264 output.mp4

5，为视频添加logo

如，我有这么一个图片

ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）(1)

想要贴到一个视频上，那可以用如下命令： ./ffmpeg -i input.mp4 -i iQIYI_logo.png -filter_complex overlay output.mp4 结果如下所示：

ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）(2)

要贴到其他地方？看下面：右上角： ./ffmpeg -i input.mp4 -i logo.png -filter_complex overlay=W-w output.mp4 左下角： ./ffmpeg -i input.mp4 -i logo.png -filter_complex overlay=0:H-h output.mp4 右下角： ./ffmpeg -i input.mp4 -i logo.png -filter_complex overlay=W-w:H-h output.mp4

8.3 去掉视频的logo

有时候，下载了某个网站的视频，但是有logo很烦，咋办？有办法，用ffmpeg的delogo过滤器。语法：-vf delogo=x:y:w:h[:t[:show]] x:y 离左上角的坐标 w:h logo的宽和高 t: 矩形边缘的厚度默认值4 show：若设置为1有一个绿色的矩形，默认值0。

ffmpeg -i input.mp4 -vf delogo=0:0:220:90:100:1 output.mp4 结果如下所示：

ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）(3)

6、抓取视频的一些帧，存为jpeg图片

比如，一个视频，我想提取一些帧，存为图片，咋办？ ffmpeg -i input.mp4 -r 1 -q:v 2 -f image2 pic-d.jpeg -r 表示每一秒几帧 -q:v表示存储jpeg的图像质量，一般2是高质量。如此，ffmpeg会把input.mp4，每隔一秒，存一张图片下来。假设有60s，那会有60张。

60张？什么？这么多？不要不要。。。。。不要咋办？？可以设置开始的时间，和你想要截取的时间呀。 ffmpeg -i input.mp4 -ss 00:00:20 -t 10 -r 1 -q:v 2 -f image2 pic-d.jpeg -ss 表示开始时间 -t表示共要多少时间。如此，ffmpeg会从input.mp4的第20s时间开始，往下10s，即20~30s这10秒钟之间，每隔1s就抓一帧，总共会抓10帧。

其他小众的用法.1输出YUV420原始数据

对于一下做底层编解码的人来说，有时候常要提取视频的YUV原始数据。怎么坐？很简答： ffmpeg -i input.mp4 output.yuv 怎么样，是不是太简单啦？！！！哈哈

如果你想问yuv的数据，如何播放，我不会告诉你，RawPlayer挺好用的！！

那如果我只想要抽取某一帧YUV呢？ 简单，你先用上面的方法，先抽出jpeg图片，然后把jpeg转为YUV。比如：你先抽取10帧图片。 ffmpeg -i input.mp4 -ss 00:00:20 -t 10 -r 1 -q:v 2 -f image2 pic-d.jpeg 结果：

-rw-rw-r-- 1 chenxf chenxf 296254 7月 20 16:08 pic-001.jpeg -rw-rw-r-- 1 chenxf chenxf 300975 7月 20 16:08 pic-002.jpeg -rw-rw-r-- 1 chenxf chenxf 310130 7月 20 16:08 pic-003.jpeg -rw-rw-r-- 1 chenxf chenxf 268694 7月 20 16:08 pic-004.jpeg -rw-rw-r-- 1 chenxf chenxf 301056 7月 20 16:08 pic-005.jpeg -rw-rw-r-- 1 chenxf chenxf 293927 7月 20 16:08 pic-006.jpeg -rw-rw-r-- 1 chenxf chenxf 340295 7月 20 16:08 pic-007.jpeg -rw-rw-r-- 1 chenxf chenxf 430787 7月 20 16:08 pic-008.jpeg -rw-rw-r-- 1 chenxf chenxf 404552 7月 20 16:08 pic-009.jpeg -rw-rw-r-- 1 chenxf chenxf 412691 7月 20 16:08 pic-010.jpeg

然后，你就随便挑一张，转为YUV:

ffmpeg -i pic-001.jpeg -s 1440x1440 -pix_fmt yuv420p xxx3.yuv

如果-s参数不写，则输出大小与输入一样。

当然了，YUV还有yuv422p啥的，你在-pix_fmt 换成yuv422p就行啦

2. H264编码profile & level控制背景知识

先科普一下profile&level吧，知道的请放过。（这里讨论最常用的H264）
H.264有四种画质级别分别是baseline extended main high：
　　1、Baseline Profile：基本画质。支持I/P 帧，只支持无交错（Progressive）和CAVLC；
　　2、Extended profile：进阶画质。支持I/P/B/SP/SI 帧，只支持无交错（Progressive）和CAVLC；(用的少)
　　3、Main profile：主流画质。提供I/P/B 帧，支持无交错（Progressive）和交错（Interlaced），
　　　也支持CAVLC 和CABAC 的支持；
　　4、High profile：高级画质。在main Profile 的基础上增加了8x8内部预测、自定义量化、无损视频编码和更多的YUV 格式；
H.264 Baseline profile、Extended profile和Main profile都是针对8位样本数据、4:2:0格式(YUV)的视频序列。在相同配置情况下，High profile（HP）可以比Main profile（MP）降低10%的码率。
根据应用领域的不同，Baseline profile多应用于实时通信领域，Main profile多应用于流媒体领域，High profile则多应用于广电和存储领域。

下图清楚的给出不同的profile&level的性能区别。
profile

ffmpeg 音核心技术（FFmpeg音实战开发详解及常用命令使用）(4)