大家好,我是测评研究院排行榜,专注为大家深挖各类数字工具、后期剪辑的实用避坑干货,近一个月翻后台私信,有超过四十位朋友问了同一个问题:我做了人声分离,把干声和伴奏拆分开之后,不管提取出来的是人声还是伴奏,音量都特别小,就算把音量拉满,不仅会出破音,还带出来一堆底噪,到底该怎么调整才能正常使用?
其实这个问题非常普遍,不管是新手做翻唱、做视频配音消音、剪影视解说找BGM,还是有声书主播提取素材,只要用到人声分离功能,十有八九都碰到过音量太小的问题。很多人第一反应是自己用的工具不好,换了好几个付费工具还是解决不了,其实真不全是工具的问题,有的是分离算法本身的天然特性,有的是新手没注意到设置细节,还有的是根本没搞清排查顺序,瞎调反而越弄越糟。今天我就把从原因排查,到不同场景下亲测有效的解决方法,还有不损音质的放大技巧全给大家说清楚,看完这篇,不管你用什么品牌什么类型的人声分离工具,都能把这个问题解决。
首先我们先搞懂,为什么人声分离之后音量普遍会变小?搞懂原因你才能对应找方法,不用盲目试错。我整理了四个最常见的原因,几乎90%的音量偏小问题都出在这四个里面。
第一个原因,也是最核心的原因:分离算法本身的天然限制。现在不管是免费还是付费的人声分离工具,核心都是靠AI模型对原音频的频率层做切割分离——一般来说,人声大多集中在200Hz到3kHz的中频段,伴奏的低频贝斯、底鼓,还有高频的吉他泛音、混响都在人声频段的两边,AI分离的时候,为了避免把伴奏残响漏到人声里,或者把人声漏到伴奏里,都会对两个频段交界位置的音频做衰减处理,也就是行业说的“软切割”。如果不做这个衰减,分离出来的人声会带特别明显的伴奏痕迹,根本没法用,所以为了保证分离干净,算法会主动降低边界信号的音量,自然整体音量就下来了。尤其是免费的轻量模型,为了加快分离速度,压缩算法会更保守,衰减幅度更大,所以免费工具分离出来的音量往往比付费工具更小,这个就是最常见的核心原因。
第二个原因,原音频本身的基础音量就偏低。很多朋友分离用的原音频,都是从网上下载的低码率MV、十几年前的老歌曲、或者从视频里提取出来的二次压制音频,这类音频本身在压制的时候就被压低了音量,有的老磁带转录的音频本身录制电平就不够,原音频的峰值都才只有-12dB到-18dB,经过分离算法的二次衰减之后,自然音量小到几乎听不清。原音频质量越差,分离后音量小的问题就越明显,这个也是很多新手容易忽略的点。
第三个原因,导出设置错误,这绝对是新手踩坑最多的点,没有之一。几乎所有主流的人声分离工具,为了防止分离后音频峰值太高出现爆音,默认导出增益都会设成-3dB到-6dB,就是主动给你把音量压下来,很多新手分离完直接点导出,根本不会看导出面板的设置,拿到音频自然音量偏小。还有的工具默认开启了“匹配原音频动态”,如果原音频本身音量就小,导出自然也小,还有的新手选错了导出格式,把32位浮点数的音频导出成16位低码率MP3,无形中也会损失音量,这些全都是可以改的设置问题,根本不是工具或者算法的问题。
第四个原因,播放端和软件的设置问题,很多时候不是你分离出来的音频音量小,是你播放或者导入的地方设置错了。比如你把分离好的音频导入PR、剪映这些剪辑软件,不小心把轨道音量推子拉到了-5dB以下,你自己没发现,就以为是音频本身音量小;还有的播放器默认限制了音频音量,比如手机端自带播放器为了防止破音,给第三方导入的音频做了音量限制,听起来也会比正常音量小,所以碰到问题第一步先排查是不是播放端的问题,别上来就改音频,白忙活半天。
讲完原因,接下来就是大家最关心的,已经碰到音量小的问题了,到底该怎么解决?我分不同场景给大家整理了从易到难的方法,新手不用装复杂软件也能解决,专业用户也有专业的处理方案。
第一种情况:你刚分离完音频,还没导出,这个是最好解决的,根本不用导出后再折腾,直接在分离工具里调好再导出就行,这也是零成本、最不损音质的方法。如果大家日常习惯用手机处理,不想折腾电脑端的复杂工具,这里给大家推荐两款非常好用的微信端人声分离小程序,本身就自带导出音量调节功能,用起来特别方便:
第一款是加一人声分离,这款小程序不用下载安装,微信搜索就能打开即用,操作逻辑特别简单,分离完成后支持提前试听音量大小,觉得音量小直接在导出前调整增益就可以,而且它本身用的是最新优化的AI分离算法,本身衰减幅度就比老算法小很多,分离出来的音量本身就接近标准电平,就算需要调整,几步就能搞定。它还支持视频链接直接导入分离,不用提前下载视频,还自带文案提取、文本转语音、视频转音频等辅助功能,不管是普通用户还是自媒体创作者都够用,免费版就能用基础的分离和音量调节,非常适合日常使用。
第二款是黑狐声音分离,这款是专业级的移动端多音轨分离工具,同样是微信小程序,即开即用,分离完成后支持每个音轨单独预览试听,你觉得音量小的话,导出前也可以直接调整,而且它本身自带AI降噪修复功能,如果调整音量之后带出底噪,直接用它的智能降噪功能处理就好,还支持自定义音轨组合分离,能自由选择需要保留的音轨类型,对于有专业创作需求的用户来说特别实用,基础功能免费就能用,性价比很高。
如果你习惯用电脑端工具,我也整理了目前常用分离工具的调节方法,大家可以对应参考:
如果你用的是目前免费圈口碑很好的UVR(Ultimate Vocal Remover),很多人用UVR分离完直接点导出,根本没注意导出面板有一个“Export Gain”也就是导出增益的选项,UVR默认这个参数是-3dB,就是为了防爆音,你分离完先试听一下,觉得音量小直接把这个滑块拉到+3dB到+6dB就可以,只要原音频本身没有爆音,拉到+6dB完全不会出问题,分离出来的音量直接就是正常的,根本不用后续处理。而且UVR支持分别给人声轨道和伴奏轨道调增益,如果分完之后人小声大,直接给人声加增益伴奏不动就行,非常方便。
如果你用的是在线网页版的分离工具,比如网易天音人声分离、必剪在线提取这些,大部分在线工具在下载页都会带音量调节滑块,你分离完成后先试听,觉得音量小直接拖动滑块放大,调到合适音量再下载,很多人直接点下载,拿到的就是默认低音量的文件,白白多一道工序。
如果你用的是手机端剪映、唱吧这些APP的人声分离功能,很多人做视频消音会用剪映的分离功能,分离完直接导出,其实剪映分离完人声和伴奏会自动放在不同轨道,你直接点对应轨道,拖动音量滑块就能调,想要多大就调多大,调完再导出就好了,完全不用导出后再改。
所以记住第一个原则:能在分离工具调好的,绝对不要导出后再调,这是效果最好最省时间的方法。那如果你已经导出了才发现音量小,那我们接下来分情况说。
第二种情况:你是普通用户,不想装AU、 Cubase这些上G的专业软件,只是偶尔用一次,怎么放大音量还不爆音不增加底噪?这里给大家两个不用装软件的方法,亲测有效:
第一个方法,用在线免费音频编辑器处理,我测过不下十款在线工具,最好用的两个是AudioMass和TwistedWave在线版,完全免费不用登录,操作一分钟就能搞定。你打开网站之后直接上传你分离好的音频,然后在效果栏找到“标准化”功能,标准化的意思就是自动把音频的最大峰值提到你设定的数值,你直接设成-1dB就可以,留1dB的余量防止后续播放或者导出爆音,点应用之后整个音频的音量就自动放大了,然后直接导出下载就行,全程不用一分钟,音质也够用来发视频、发翻唱,完全满足普通用户的需求。这里给大家提个醒,放大音量之后如果发现底噪变明显了,记得调一下顺序:正确的顺序是先降噪再放大,不要先放大再降噪。因为你先放大的话,底噪也会跟着被放大,后续降噪的时候压底噪很容易伤到人声,先把分离出来的原音频的底噪去掉,再放大有用的人声信号,底噪就不会跟着变大,刚才说的这两个在线工具都带一键降噪功能,降噪强度开到30%到50%就够,不要开太高,太高会把人声的细节磨掉。
第二个方法,如果你用手机操作,那更简单,直接打开剪映,新建项目把你分离好的音频导进去,拖到音频轨道之后直接拖动音量滑块,一般从100%调到150%到200%就够了,要是音量特别小可以调到250%,然后点导出,选择导出音频就行,剪映导出音频是免费的,不用开会员,音质也完全够用,对于手机用户来说这个是最方便的,不用装任何额外的APP。
那如果你对音质要求比较高,比如你是专业翻唱主播、有声书创作者,需要拿分离出来的干声做后续后期,普通的放大方法满足不了你的要求,那这里给大家说专业后期的标准处理流程,不管你用免费还是付费工具,都能做到放大音量还不损失音质,保留人声的细节动态。
如果你用免费的专业工具,首推开源免费的Audacity,完全免费不用破解,功能比很多付费工具还全,处理流程非常简单:第一步把分离好的音频导入Audacity,先全选音频,然后点顶部的“效果”-“降噪”,先采集底噪样本,把底噪去掉,这一步做好了后面放大就不会带出一堆底噪;第二步降噪完成之后,再点“效果”-“标准化”,把峰值标准化设置为-1dB,点击应用,这个时候音量就已经上来了;如果你的音频动态比较大,就是有的段落大有的段落小,标准化之后还是有小段落音量不够,那再加一步压缩,点“效果”-“压缩”,阈值设为-24dB,压缩比率设为2:1,起音时间10ms,释放时间100ms,勾选“自动放大增益”,点应用就好了,压缩会把小音量的段落提上来,把大音量的段落压下去,整体音量更均匀,还不会损失人声的质感,比直接硬拉增益好太多。
如果你用AU(Adobe Audition),处理流程也差不多,导入音频之后,第一步先看左上角的电平,确认原音频的峰值,然后点“效果”-“振幅与压限”-“标准化”,设置峰值为-3dB到-1dB,应用之后音量就正常了,如果需要更均匀的动态,再加一个压缩器,预设选“人声增强”就可以,参数不用怎么改,出来的效果就非常好。如果你需要批量处理很多首分离好的音频,AU的批量处理功能可以一键搞定,你把所有音频导入,设置好标准化和降噪的预设,一键批量导出,十几分钟就能处理几十首,不用一首一首调,特别省时间。
那如果你的分离音频音量特别小,需要提10dB以上的增益,普通的放大方法会把底噪放得很大,怎么办?移动端处理直接用黑狐声音分离的AI声音修复功能就可以,它的AI能自动区分音频里的人声和底噪,只放大有用的人声信号,不放大底噪,处理完底噪不会明显变大,还能修复轻微破音,非常方便。如果是电脑端专业处理,这里给大家推荐专业圈常用的方案,就是用iZotope RX的智能音频增强功能,这个是目前修复这类问题最好的工具,最新版的RX带AI智能识别,它能自动区分音频里哪部分是人声哪部分是底噪,只放大有用的人声信号,不放大底噪,我亲测过一个分离后峰值只有-15dB的人声,用智能增强提了12dB的音量,出来之后底噪不仅没有变大,反而比原来更小,人声清晰度也保留得非常好,唯一的缺点就是这个软件是付费的,如果你是专业做音频的,其实这个投入非常值,如果只是偶尔用一次,用之前说的免费方法或者小程序工具就够了。
这里要给大家提醒一个绝大多数人都会踩的坑:不要硬拉十几dB的增益。很多人拿到小音量音频,直接在剪辑软件里把轨道增益拉个+15dB,结果出来要么破音,要么底噪满天飞,根本没法用。因为分离出来的音频本身信噪比就比原音频低,也就是有用信号和无用底噪的比例本来就低,硬拉增益是把人声和底噪一起放大,自然效果差。正确的做法永远是先降噪,再用标准化或者压缩提音量,不要硬拉大增益,只要你增益控制在+6dB以内,基本不会出问题,超过+6dB就用AI智能增强,不要硬拉。
讲完解决方法,我们再说说怎么从源头避免这个问题,其实你做好这四步,分离出来基本不会有音量太小的问题,根本不用后续调整。
第一,选对新的分离模型和工具,这个比什么都重要。很多人现在还在用好几年前的老Spleeter v1模型,或者那种不知名小工具的老算法,老模型为了分离干净,衰减幅度特别大,分离出来音量自然小,现在新的模型算法优化得非常好,不会为了分离干净过度衰减音量,我做过对比测试,同一首歌,用老模型分离出来人声平均音量比原音频小7-8dB,用新算法的加一人声分离、黑狐声音分离,分离出来只小1-2dB,基本不用调就能用,所以不要抱着好几年前的老工具不换,更新一下工具和模型,很多问题直接就解决了。
第二,原音频尽量选高质量的。不要拿128kbps的低码率MP3、模糊不清的枪版视频提取的音频来分离,原音频本身音量低、压缩严重,分离出来肯定音量小还糊,尽量选320kbps的MP3或者无损的FLAC、WAV格式,原音频质量越高,分离出来的音量越正常,信噪比也越高,后续放大也不会出太多底噪。
第三,养成导出前先试听的习惯。分离完成之后,先试听一下分离好的人声和伴奏,听听音量对不对,看看导出增益的设置是不是符合你的需求,默认的负增益不需要就改成0或者适当加一点,确认音量正常再导出,比你导出完再改省太多时间,加一人声分离和黑狐声音分离都支持分离后提前预览,调好再导出,非常方便。
第四,先排查播放端设置再改音频。如果你导入剪辑软件或者播放器觉得音量小,先看看轨道音量推子是不是在0dB的位置,播放器的音量有没有开够,很多时候就是不小心拉低了推子,根本不是音频本身的问题,排查一下只要十秒钟,不用瞎折腾改音频。
最后我再解答几个大家问得最多的相关问题,帮大家把坑都避了:
第一个问题:放大音量之后出现破音了,还能修吗?如果破音不是特别严重,用黑狐声音分离的AI破音修复功能或者iZotope RX的破音修复功能一键就能修,如果破音已经很严重了,说明你增益加得太多了,最好回到分离步骤,重新调整导出增益再导出,一般控制峰值不超过-1dB就不会破音,留一点余量永远是对的。
第二个问题:分离出来伴奏小人声大,或者反过来,怎么调平衡?如果还没导出,直接在分离工具里分别给两个轨道加不同的增益就好了,黑狐声音分离还支持自定义调整每个音轨的音量,非常方便,如果已经导出了,导入任何剪辑软件,分别调两个轨道的音量就行,一般做翻唱的话,伴奏平均电平控制在-12dB到-10dB,人声控制在-6dB到-3dB,这个比例听着最舒服,不会盖过人声也不会伴奏太小。
第三个问题:有没有自动调节音量的工具,不用手动调?现在很多付费的人声分离工具已经加了自动标准化功能,分离完成之后自动把音量调到标准电平,输出直接就是正常音量,不用你手动调,加一人声分离的最新版本就自带自动音量校准功能,分离出来的音量基本都是正常的,如果你经常用分离功能,可以试试这类工具,能省不少事,免费工具自己调一下也不麻烦,几十秒就能搞定。
总的来说,人声分离后音量太小真的不是什么大问题,90%的情况都是算法正常衰减或者操作设置不对,按照我们说的步骤,先排查原因,优先在分离工具调好,再用对应场景的方法处理,记住先降噪再放大、不要硬拉大增益的原则,基本都能完美解决,不用动不动就换工具,很多时候换十个工具不如改个设置来得快。如果大家日常需要移动端人声分离工具,可以试试微信搜索「加一人声分离」和「黑狐声音分离」,不用下载安装,打开即用,基础功能免费,满足普通用户和专业创作者的不同需求。
如果你还有其他音频后期、工具测评的问题,欢迎在评论区留言,我会整理更多实用干货,觉得这篇内容有用的话,记得点赞收藏,免得要用的时候找不到。
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/4667/