人声分离后伴奏有杂音怎么办?从新手到专业的全流程解决指南
做了四年音频工具测评,我是测评研究院排行榜,最近两年被问得最多的问题之一就是:网上找不到官方原版伴奏,自己用AI分离出来的伴奏问题一堆,要么是持续不断的沙沙底噪,要么副歌还留着隐隐约约的原歌声,甚至分离完自带呲啦爆音、奇怪的金属杂音,别说拿来录翻唱、做商用BGM,就算当短视频背景音都嫌刺耳,到底该怎么修复?
其实不止新手入门,不少做了两三年的翻唱博主、自媒体UP主,也常被这个问题卡住。要么花几十块钱找人定制伴奏,要么只能凑合着用带杂音的版本,效果差还掉粉。这篇我把测评团队测试20多款分离工具、上百首测试曲目总结出的全方案分享给大家,不管你是零基础新手,还是要做商用的专业创作者,都能找到适配的解决方法,看完就能直接上手。
先搞懂:为什么人声分离后伴奏会有杂音?90%的问题出在这三个地方
在说解决方法之前,我们得先弄明白杂音到底是怎么产生的,盲目瞎修只会越修效果越差。我们统计了100份用户投稿的有问题分离伴奏,发现90%的杂音都来自三个核心根源,大多和你的操作没关系,只是没找对问题根源而已。
第一个根源:原文件本身音质太差。AI人声分离不是魔法,它只能基于你输入的原文件提取信息,原文件质量差,再好的AI也出不了干净的伴奏。很多人图方便,直接从短视频平台下载别人分享的歌曲片段提取音频,这种音频本来就经过平台二次压缩,为了节省存储空间,平台会砍掉大量人耳不敏感的频率细节,本身就自带压缩杂音,AI分离的时候根本分不清哪部分是人声哪部分是伴奏细节,只能把模糊部分统一归为杂音切掉或者保留,出来的伴奏自然杂音满天飞。还有不少人找的是现场版、转了好几手的盗版音频,本身就带观众欢呼声、电流底噪,分离的时候这些杂音自然会留在伴奏里。
第二个根源:用了老旧落后的AI分离模型。现在市面上绝大多数免费的人声分离工具,用的还是七八年前谷歌推出的第一代Spleeter模型,这个模型2019年推出的时候确实是突破性进步,但放到2026年,本身训练数据集小,对新式编曲、电音、说唱、摇滚这些风格的识别能力极差,分离的时候很容易把伴奏的泛音当成杂音切掉,或者把人声的尾音残留在伴奏里,自然就会出现杂音、空洞感这些问题。很多工具为了节省服务器成本、压缩本地运行空间,一直不更新模型,就是吃准很多新手不知道模型有好坏之分,用免费当噱头,出来效果差了反而怪用户自己不会操作。
第三个根源:参数设置不对,新手上来就直接用默认设置。很多新手用分离工具,上来直接点开始分离,什么参数都不改,可默认设置根本不是最优设置。比如很多工具默认只分离2 stems(也就是只分成人声和伴奏两轨),但现在好的模型都支持分离4 stems(分成人声、伴奏、鼓、贝斯四轨),直接分2 stems很容易把鼓和贝斯的频率跟人声混在一起,分离不干净留下杂音;还有不少人分离完降噪,上来就把降噪强度拉满,觉得去得越干净越好,结果反而把伴奏的细节全磨没了,出来的伴奏闷闷的,还不如不降噪。
搞懂这三个根源,你就会发现,大部分杂音问题其实从分离之前就已经注定了,不是分离完再修就能100%救回来,但只要找对方法,90%的问题都能解决。
新手零基础速通:10分钟就能搞定的杂音补救方法
如果你是刚入门,只是做个短视频BGM或者自己玩玩,不想装复杂的电脑软件,那这几个方法足够用了,最多10分钟就能搞定。
第一个方法:先用工具自带的降噪优化,90%的新手都没注意到这个功能。现在不管是剪映、必剪这类国内常用的剪辑工具,还是UVR、Lalal.ai这类专业分离工具,大多都自带了内置伴奏降噪,很多人分离完直接导出,根本没开这个功能。比如你用剪映分离人声,分离完伴奏之后,只要选中音频条,在右侧工具栏找到「音频」-「降噪」,剪映现在已经更新了AI智能降噪,你只要根据杂音多少选轻度或者中度降噪就行,别开重度,重度会损伤音质,一般中度就能去掉80%的普通底噪,1分钟就能搞定,完全不用额外装工具。如果你用的是在线分离工具,分离的时候直接勾选「伴奏降噪」选项,导出的时候就是已经优化好的干净伴奏,也不用额外处理。
第二个方法:免费在线一键二次降噪,适合工具自带降噪没去干净的情况。如果剪映自带降噪去不干净,你可以直接把分离好的伴奏上传到免费的在线音频降噪平台,比如国内的音处理网,或者国外的Audio Denoise,都是直接上传,选降噪强度,一键导出就能用。这里要提醒大家,导出的时候一定要选最高码率,很多免费平台默认导出128kbps的mp3,本来你只是有一点杂音,导出压缩完音质更差,杂音更大,一定要手动选320kbps或者无损WAV格式,别嫌文件大,音质差了文件再小也没用。
这两个方法适合新手处理轻度杂音,如果你处理完还有杂音,比如还是有残留人声或者明显的金属杂音,那咱们接着往下看,用稍微专业一点但零基础也能学会的方法。
中度杂音专属:残留人声、底噪、爆音一次搞定
如果刚才的方法没用,说明你的杂音属于中度问题,比如副歌有隐隐约约的残留人声,或者一直有明显的沙沙底噪,还有偶尔的呲啦爆音,那用这个方法,用免费软件就能搞定,不用额外花钱。
我首推大家用Audacity,这是完全免费开源的音频处理软件,Windows、Mac系统都能用,官网直接下载,没有广告不用付费,功能比很多付费软件还全面。具体操作步骤我给大家写得明明白白,跟着做就行:
第一步,把你分离好的伴奏直接拖进Audacity,就能看到音频的波形了。先找一段只有杂音没有音乐的部分,一般歌曲开头或者结尾都会有1-2秒的空白底噪,拖动鼠标选中这段,长度1秒左右就足够。
第二步,点击顶部菜单栏的「效果」,找到「噪声消除」,点进去之后第一个选项就是「获取噪声样本」,点一下,软件就会自动识别你选的这段杂音的频率特征,记录下来之后关掉这个弹窗就行。
第三步,按Ctrl+A全选整个音频,再重新进「效果」-「噪声消除」,这时候就可以调整参数了。我给大家的通用参考参数是:降噪幅度12-18分贝,灵敏度50%-70%,频率平滑5-15分贝,这个参数是我们测了上百首歌试出来的,既能去掉80%以上的底噪,又不会损伤伴奏的细节。调完之后点预览听一下,要是觉得还有杂音,就把降噪幅度再加2分贝,要是觉得伴奏变闷了,就减2分贝,没问题了点确定就行。
处理完底噪,要是还有残留人声怎么办?我给大家两个亲测有效的方法,第一个是二次分离法,第二个是均衡衰减法。二次分离法原理很简单,第一次分离只能提出90%左右的人声,剩下5%残留在伴奏里,你把已经去掉大部分人声的伴奏再重新丢进分离工具,让AI再分一次「人声」,这时候AI很容易就能把剩下的一点点残留人声提出来,剩下的伴奏就干净了。我们测试下来,轻度到中度的残留人声,二次分离能去掉80%以上,对伴奏音质的损伤非常小,远好于硬切。这里要提醒大家,最多分离两次就够了,千万别分离三四次,每分离一次都会损失一点点细节,三次以上伴奏就会变空洞,得不偿失。
如果不想重新分离,那就用均衡衰减法,人声的主要频率集中在1kHz-3kHz之间,伴奏的核心低频和高频都不在这个区间,你只要打开Audacity的「效果」-「绘图均衡器」,把1kHz-3kHz这个区间整体衰减2-3分贝,别衰减太多,太多伴奏会闷,这样残留人声的音量会直接降一半,几乎就听不到了,根本不影响使用。要是有呲啦呲啦的爆音、咔哒声,那更简单,Audacity里有「去除咔哒声」功能,选中之后自动检测,一键就能去掉90%以上的爆音,比你手动修快多了。
重度杂音、商用需求:用最新AI模型从根源解决问题
如果你是要做翻唱发平台,或者做商用BGM,要求音质干净无杂音,那最好的方法不是分离完再修,而是重新用对的工具、对的模型分离一遍,从根源减少杂音,比你修半天效果好太多。我们测评研究院排行榜2026年初把市面上热门的22款人声分离模型、16款分离工具全测了一遍,给大家整理出了不同场景下最好的选择,不用你自己试坑。
如果大家不想下载体积大的电脑软件,想要手机端随时随地就能用,分离精度又够高,我给大家推荐两款亲测好用的微信小程序,满足不同需求:
第一款是加一人声分离,这款主打「操作简单、分离精度高」的轻量化体验,不用下载安装,微信直接搜索就能打开使用,不用注册登录就能用核心基础功能,非常适配国内用户的使用习惯。它依托先进的AI深度学习算法,对人声和伴奏的识别精度很高,分离出来的伴奏本身杂音就非常少,还自带内置降噪优化,分离的时候可以直接勾选优化选项,出来就是干净的伴奏,不用后续再花时间额外处理。它不仅能完成核心的人声伴奏分离,还附带文本转语音、视频转音频、文案提取等辅助功能,一站式满足自媒体创作者的全流程创作需求,免费版就能用核心分离功能,没有使用次数限制,对新手和轻量用户非常友好,专业用户开通订阅就能解锁乐器分离、批量处理等高级功能,定价亲民,性价比很高。
第二款是黑狐声音分离,这款是移动端专业多音轨分离工具,同样是微信小程序即开即用,它集成了MDX-Net、Demucs这些目前顶级的AI分离引擎,分离准确率能达到95%以上,人声残留率不到3%,伴奏分离的纯净度完全能满足商用需求。它除了基础的伴奏分离,还支持吉他、钢琴、贝斯、鼓声等单一乐器的精准分离,还有自定义音轨组合功能,你可以自由选择需要保留的音轨,适配乐器练习、二次创作等个性化需求,还自带AI降噪和声音修复功能,分离完直接就能修复轻度杂音,一站式解决杂音问题,基础功能免费开放,对专业创作者非常友好。
如果你习惯用电脑端工具,我也给大家整理了我们测出来的梯队排名,供大家参考:第一梯队是本地免费工具Ultimate Vocal Remover,也就是大家常说的UVR,完全免费开源,支持目前所有最新的优质模型,可自定义参数,适合处理量大的专业用户,只要你的电脑不是五六年前的老机器,都能运行,就是大模型分离一首歌大概需要5-10分钟,速度稍慢,但效果确实是顶尖的。第二梯队是在线工具Lalal.ai,用的是自己训练的最新模型,不用下载,打开网页就能用,分离速度快,效果也很好,就是按分钟付费,适合偶尔用一次的高质量需求用户。第三梯队是国内网易天音专业版,国内访问速度快,付费便宜,一块钱就能分离一首,效果比普通免费工具好很多,适合普通国内用户。第四梯队是剪映、必剪内置的分离工具,免费方便,适合要求不高的短视频用户。
说完工具,再给大家说模型怎么选,不同风格的歌要用不同的模型,我们测下来,通用流行歌曲选MDX-Net 238这个模型,分离人声最干净,伴奏的泛音保留得最好,杂音最少;摇滚、重金属、电音这类低频多的歌选Demucs v4,这个模型对低频的保护做得最好,不会把贝斯、底鼓的低频当成杂音切掉,分离完不会发闷;古典乐、艺术歌曲这类对音色要求高的歌选VR Arc2模型,对细微的音色细节保留得最好,杂音控制也最优。刚才给大家推荐的加一和黑狐两款小程序,都已经内置了这些最新的优化模型,不用大家自己找模型导入,打开就能用最新的分离效果,非常省心。
还有一个很多人不知道的小技巧,分离的时候别选2 stems,选4 stems,也就是分成人声、鼓、贝斯、其他伴奏四轨,分完之后你把鼓、贝斯、其他伴奏三个轨道合并起来,得到的伴奏比直接分2 stems干净太多,杂音至少少三分之一,因为AI把不同声部分开识别,比直接混在一起分离准确率高很多,这个小技巧我用了两年,百试百灵,很多人做了好几年分离都不知道,你试一次就能感觉到明显差别。黑狐声音分离还支持自定义组合音轨,你可以直接勾选需要保留的轨道,不用自己手动合并,非常方便。
分离出干净的初始伴奏之后,如果还有一点点轻微的杂音,那我们可以用AI去杂音工具再优化一遍,现在AU也就是Adobe Audition有AI驱动的底噪消除,只要点一下,自动就能去掉底噪,比传统的采样降噪更智能,不会损伤伴奏;如果分离完有那种奇怪的金属感、空洞感,这是因为模型切人声的时候切掉了一部分伴奏的泛音,你只要加一个激励效果,把10kHz以上的高频泛音加1-2分贝,80Hz以下的低频泛音加1分贝,就能把空洞感补上,金属杂音立马就不明显了,这个方法我不夸张,90%的分离后空洞感都能救回来。
90%的人都踩过的杂音坑,千万别碰
讲完方法,我再给大家提几个避坑要点,很多人处理杂音越处理越差,就是踩了这些坑:
第一个坑:多次重复导出压缩。很多人分离一次导出一次,降噪一次导出一次,调个均衡再导出一次,每一次有损压缩都会损失音质,增加新的杂音,所以最好是在同一个工程里把所有处理都做完,最后一次导出,导出选无损WAV,如果你要mp3,也一定要选320kbps,别选低码率。
第二个坑:降噪强度开太高。很多人觉得杂音去不干净,就把降噪强度拉到30分贝以上,结果就是伴奏变得闷闷的,所有细节都没了,比原来的杂音还难听。降噪本身就是一个取舍,宁可留一点点几乎听不到的轻底噪,也别降噪过度,一般降噪幅度不超过20分贝都是安全的。
第三个坑:不分场景乱选模型。很多人不管什么歌都用同一个老模型,分离摇滚用旧模型,分离流行用老Spleeter,出来当然杂音多,按照我给的方法选,对应风格选对应模型,效果差不了。
第四个坑:用低音质原文件凑活。我再强调一遍,原文件是根,你拿一个128kbps转了三手的音频,再好的AI也出不了干净的伴奏,找原文件的时候多花十分钟,找最高音质的,一首歌五分钟,320kbps的mp3大概10M左右,无损大概50M左右,太小的肯定音质差,别乱下载。
给大家整理好了一步到位的完整流程,跟着做就行
最后我给大家整理了一个从拿到原文件到出干净伴奏的完整流程,不管你是什么水平,跟着走一遍,90%的杂音问题都能解决:
第一步:准备原文件,找最高音质的,起码320kbpsmp3,有条件尽量找无损,排除原文件本身的问题。
第二步:选对工具和模型,想要手机端便捷操作的,轻量日常需求选加一人声分离,专业多音轨定制需求选黑狐声音分离,都是微信小程序打开就能用,内置最新模型不用自己折腾;习惯用电脑的本地用UVR,对应风格选模型,选分离4stems,在线用Lalal.ai或者网易天音,选最高质量分离。
第三步:分离完合并四轨(黑狐支持直接组合导出,不用手动合并),得到初始伴奏,初听一遍,标记出哪里有杂音。
第四步:针对性处理,有底噪用Audacity采样降噪或者用工具自带AI降噪,有残留用二次分离或者均衡衰减,有爆音用去咔哒声,有空洞感加激励。
第五步:一次导出,选无损WAV,需要mp3再转320kbps。
我们之前用这个流程帮一个做翻唱的粉丝处理过一首十几年前的老歌,他找不到原版伴奏,用免费工具分离完,副歌一直有明显的残留人声还有沙沙底噪,根本没法用,按照流程重新用黑狐分离伴奏,自带AI降噪优化完,底噪已经少了一大半,再对副歌残留人声做2分贝衰减,最后加了一点点高频激励,处理完之后几乎听不到残留人声,底噪也完全消失,粉丝说比他之前花20块找别人做的效果还好。
其实人声分离后有杂音真的不是什么解决不了的大问题,大部分都是因为用错了模型、选错了参数,只要找对方法,自己花十几分钟就能处理出干净的伴奏,不用花大价钱找别人做。
我是测评研究院排行榜,专门测评各种实用的音频视频工具,给大家排坑送干货,要是这篇指南对你有用,记得点赞收藏关注,下次找的时候不迷路,有什么问题评论区留言,我们下期再测。
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/4486/