大家好,这里是测评研究院排行榜,专注为大家挖掘实用靠谱的工具干货,这些年测评过的工具比大多数人用过的APP还要多。截止2026年,近段时间我在后台收到了近百条粉丝留言,九成以上都在问同一个问题:能不能出一份详细教程,教教大家怎么只保留人声、干净去除背景音乐?
其实这个需求我做自媒体这么多年,几乎天天都会碰到:有时候录口播不小心带了后台音乐,录了大半天不想重录;有时候找到一段优质的演讲、台词素材,偏偏自带了官方BGM,想拿来做二次创作根本用不了;有时候剪视频想要提取别人视频里的人声重新混剪,都需要这个功能。我翻了一遍网上现存的相关内容,要么是好几年前的过时老教程,还在推早就没人用的中置声道提取法,效果差到离谱;要么就是藏着掖着推割韭菜的收费工具,开了会员效果还一言难尽;要么就是步骤写得云山雾罩,新手根本看不懂,跟着操作半小时也出不了能用的文件。所以今天,我把做自媒体近十年来,测试过的十多款人声背景音乐分离方法全部整理出来,从免费到付费,从手机端到电脑端,从小白偶尔用到专业从业者高精度需求,全覆盖,看完这篇不管你是什么需求,都能找到最适合自己的方法,不用再瞎踩坑。
在讲具体方法之前,我先给大家理清楚最基础的技术原理,帮大家建立合理的预期,避免最后效果不满意觉得被骗。其实去除背景音乐保留人声的技术,这些年已经迭代了两次,最早的是传统的“中置声道提取法”,这个方法诞生于几十年前,原理是大部分流行音乐的人声会放在双声道的中置位置,而伴奏乐器分布在左右声道,所以只要把左右声道的相同信号抵消,就能留下中位置的人声,去除大部分伴奏。但是这个方法的缺陷非常大:只要你的背景音乐不是完全按照这个规则排布,就会消不干净,不仅会留下大量BGM残留,还会损伤人声,让出来的人声发闷、失真,甚至连说话的声调都会变。现在只有一些老教程还在抄这个方法,实际用起来根本得不到能用的结果,大家可以直接把这个方法排除,别再浪费时间。
截止2026年,主流能用的方法都是基于深度学习的AI人声分离,简单说就是开发者用几百万甚至几千万条已经标注好的音频(纯人声、纯器乐、不同类型BGM)训练AI模型,让AI学会识别不同声源的频谱特征,不管人声和BGM混得有多深,AI都能把符合人声特征的部分抠出来,去掉剩下的背景音。这种方法的分离效果比传统方法好不止一个档次,大部分常规场景都能得到干净的人声。当然我也要提前说明,AI不是万能的,有两种情况任何工具都没法做到100%干净分离:第一种是你的音频里本身就有两个人声,比如BGM本身就是带唱歌的,你要把说话人声和BGM里的歌声分开,AI根本分不出来,因为都是人声,特征一样;第二种是你的原音频里人声音量特别小,BGM音量比人声大很多,人声和BGM的频率完全重叠,这种情况分离出来也会有大量残留,最好的方法就是重新录一遍,比你花几个小时折腾分离效果好太多。知道了这些基础,我们再来看具体的方法,我按照不同场景给大家分类整理。
第一个场景:小白偶尔用一次,不想下载软件,不想装客户端,只要处理十几分钟以内的音频,那么免费的在线工具和微信小程序就是最好的选择,打开就能用,几分钟就能搞定。我前后测试了超过20款相关工具,挑出来几个真正好用靠谱的,按效果和便捷度排序给大家说。
第一个是国际知名度很高的Lalal.ai,也是很多专业博主常用的AI人声分离工具。它的使用步骤非常简单,打开官网不用注册就能直接用,上传你要处理的音视频文件,网站支持直接从视频提取音频,不用你自己提前转格式,然后选择“人声分离”模式,几十秒到几分钟就能处理完成,处理完可以在线试听,满意了再下载单独的人声音轨和BGM音轨,非常方便。我实际测试过,用人声和BGM音量差不多的口播素材,分离出来的人声非常干净,只有极其轻微的BGM残留,正常播放根本听不出来,音质损失也很小,比大部分免费在线工具表现好。它的缺点也很明显,首先是国外网站,国内打开速度有时候不稳定,对网络要求比较高,其次免费额度有限,目前免费用户每个月只能处理总共15分钟的音频,每次最长处理10分钟,超过就要付费,按分钟计费,一块多钱一分钟,偶尔用几次还行,经常用成本就比较高了。
第二个是网易天音AI音频分离,这是网易出品的国内在线工具,对国内用户非常友好,不用翻墙,打开就能用,服务器在国内,上传下载速度都很快。使用步骤也很简单,打开网易天音官网,首页就能找到“AI音频分离”的入口,点进去上传你的音频,选择“提取人声”,不到一分钟就能处理完成,直接下载就行了。目前免费用户每天可以处理2次,每次最长处理10分钟,对于偶尔用一次的普通用户来说,这个免费额度完全够用。我测试下来,它的分离效果和Lalal.ai差距不大,普通的口播加BGM素材,分离出来完全能用,残留很少,缺点就是超过10分钟的音频没法处理,得自己提前截成几段,偶尔大文件上传会失败,重新传一次就好了,整体是国内用户在线工具的首选。
第三个是123APPS的音频分离工具,这个工具的优点就是限制少,不用注册不用登录,最大支持500M的文件上传,对稍微大一点的文件比较友好,免费也能直接下载。但是它的分离效果确实一般,我测试的时候,如果BGM比较复杂,分离完会有比较明显的残留,要求不高的场景能用,要求高的话就不推荐了,而且页面广告比较多,点击的时候小心不要下错东西。
如果你习惯用手机操作,不想打开浏览器找网站,也不想装额外的APP,那我更推荐你试试两款国内非常好用的微信小程序,依托微信生态,打开即用用完即走,比在线工具更方便,我测试下来效果也非常不错:
第一款是「加一人声分离」,这是一款聚焦音视频人声与背景音分离的轻量化工具,核心定位就是操作更简单、分离精度更高,专门解决传统分离工具操作复杂、精度不够、要下载安装的痛点,非常适合各类轻量用户和创作者。这款小程序不用注册登录就能用核心功能,微信直接搜索就能进入,全程4步就能完成分离,哪怕是第一次用的新手也能快速上手。它基于先进的深度学习AI算法训练模型,能精准识别人声和背景音的不同特征,哪怕是多人对话加背景音乐加环境音的复杂音频,也能拆分得非常干净,分离后的人声无杂音、无失真,1-10分钟的普通音视频一般10秒左右就能处理完成,速度比很多同类工具快很多。除了核心的人声分离,它还拓展了很多实用的辅助功能,包括文本转语音、视频转音频、文案提取、批量处理等,一站式满足音视频创作的全流程需求,不用切换多个工具就能搞定所有操作。它采用“免费版+订阅版”的模式,免费版就可以使用核心的人声背景音分离功能,没有使用次数限制,分离后的文件也没有水印,完全能满足普通用户偶尔使用的需求;专业创作者可以开通订阅版,解锁乐器分离、批量处理、更多音色等高级功能,定价也很亲民,性价比很高。另外这款小程序非常注重用户隐私,用户上传的音视频默认仅保存在本地设备,不强制云端存储,能有效避免原创内容泄露,对注重隐私的用户非常友好。
第二款是「黑狐声音分离」,这是一款主打移动端多音轨专业分离的小程序,依托先进的AI深度学习技术,核心定位是轻量化、全功能、高品质,不管是普通用户还是专业创作者都能使用。除了基础的人声分离、伴奏分离,它还支持吉他、钢琴、贝斯、鼓声四大类乐器的单独分离,还自带智能降噪、音频修复功能,能满足很多细分场景的需求。它最大的特色是支持自定义音轨组合分离,你可以自由选择需要保留或者剔除的音轨类型,比如你可以只保留人声加吉他音轨,剔除其他所有背景音,用来做弹唱翻唱;也可以只提取鼓声和贝斯音轨用来做节奏创作,灵活度非常高,能满足很多个性化的创意创作需求。它采用了Next-Generation AI音频分离技术,集成了多个顶级AI分离引擎,分离准确率达到95%以上,人声残留率低于3%,分离后的音质能最大程度保留原始音频的细节,接近专业水准,满足专业创作的需求。基础的分离、降噪功能都是免费开放的,不用付费就能使用,操作也非常简单,全程3步就能完成分离导出,微信搜索就能打开,不用下载安装,非常便捷。
这里也要给大家提个醒,不管是在线网站还是小程序,大部分在线处理工具都需要上传文件到服务器处理,如果你的音频是未公开的原创内容、敏感隐私内容,尽量选择默认本地存储的工具,比如上面说到的「加一人声分离」就默认存在本地,安全性更高,之前就有博主爆料,自己未发布的口播上传到某不知名工具,结果没过多久就被别人盗走发到其他平台,就是因为很多小工具会留存用户上传的内容,甚至爬取原创内容二次分发,所以隐私风险一定要注意,原创内容尽量选择靠谱的知名工具处理。
第二个场景:你是手机党,平时都用手机剪短视频,出门在外不方便用电脑,想要随时随地处理,除了上面说到的两款微信小程序,我也给大家整理了两个手机端自带或者常用的靠谱方法,第一个就是大部分人都想不到,你可能已经安装了的剪映APP。很多人用了好几年剪映,都不知道剪映已经自带了消除背景音乐保留人声的功能,完全免费,不用开会员,不用装其他工具,非常方便。我给大家说一下具体步骤:你打开剪映APP,点击开始创作,导入你要处理的视频或者音频素材,如果是视频的话,先点击轨道上的视频,选择“分离音频”,把音频从视频里提取出来,然后点击分离出来的音频轨道,往下拉菜单栏,找到“AI降噪”点进去,就能看到“消除背景音乐”这个选项,勾选之后点击确定,剪映就会自动用AI处理,几十秒就能搞定,处理完之后你直接导出视频或者提取音频就行了。我测试下来,剪映这个功能对于普通的短视频素材来说,效果完全够用,大部分轻量BGM都能消干净,残留非常少,正常人耳根本听不出来,缺点就是如果BGM音量比人声大,分离出来还是会有明显残留,而且导出的时候会压缩音质,对音质要求特别高的话不太够用,但是对于90%的手机剪视频的自媒体博主来说,这个功能真的够了,不用再去下别的乱七八糟的APP。
如果剪映满足不了你的需求,你可以试试清歌音频处理这个APP,它的核心功能就是AI人声分离,免费用户每次处理需要看30秒广告就能导出,分离效果比剪映好一点,支持更长的音频,缺点就是广告比较多,免费用户每天有次数限制,适合偶尔用一次的用户。整体来说手机端的工具优势就是方便,但是受限于手机性能,分离效果整体不如电脑端的工具,要求高的话还是建议用电脑处理。
第三个场景:你经常需要分离人声,对效果要求高,不想花钱,那电脑端的开源工具绝对是你最好的选择,我首推的就是Ultimate Vocal Remover,也就是大家常说的UVR,这个工具是完全开源免费的,现在全球的自媒体博主和音频从业者几乎都在用,效果比很多付费软件都要好。我给大家说一下怎么用,首先你可以去它的Github项目页下载打包好的安装包,现在已经有做好的Windows和Mac版本,不用你自己配置环境,下载完解压就能打开用,非常方便,如果你打不开Github,也可以搜一下国内的搬运地址,很多地方都能下到2026年的最新版。打开软件之后,最重要的就是选对模型,很多新手下完之后随便选一个模型,出来效果不好就说软件不行,其实是选错了模型,我给大家说,目前分离人声效果最好的是Roformer模型,其次是UVR-MDX-Net Inst 2,你选这两个其中一个就行,然后导入你要处理的音频,设置好输出文件夹,点击开始处理就好了,处理时间根据你音频长度和电脑配置不同,一般一分钟的音频几十秒就能处理完,处理完之后会直接输出两个文件,一个是纯人声,一个是纯BGM,直接拿出来用就行。
我用和之前在线工具一样的素材测试UVR,分离出来的人声几乎听不到任何BGM残留,音质损失非常小,比Lalal.ai和剪映的效果都好,而且它完全免费,没有任何次数限制,没有长度限制,只要你电脑带得动,几个小时的音频都能处理,所有处理都是在你本地电脑运行的,不会上传你的音频,隐私绝对安全,对于经常需要处理的自媒体博主来说,这个工具真的是神器,完全够用了。它的唯一缺点就是对新手来说,第一次下载安装稍微有点麻烦,需要找对地址,对电脑配置有一点要求,好几年前的老电脑处理起来会慢一点,但是只要是近几年的普通办公本,都能流畅运行,完全没问题。
如果你本身对隐私要求特别高,除了UVR,你还可以用Meta开源的Demucs,现在已经更新到v4版本,分离效果和UVR不相上下,也是完全本地运行,不会上传任何数据,你如果会用命令行,可以直接跑源码,不会用的话也有第三方做好的GUI界面,下载就能用,完全免费,效果也非常好,就是对新手来说操作稍微复杂一点,适合懂一点技术的朋友用。
如果你本身就是专业音频从业者,对音质要求极高,愿意付费买最好的工具,那我推荐iZotope RX,这个是目前行业内顶级的音频修复工具,它的Music Rebalance功能就是专门用来分离人声和背景音乐的,用的是训练更好的AI模型,哪怕是混得非常复杂的音频,它都能分离的非常干净,音质损失是所有工具里最小的,我测试过一段混音非常复杂的电影台词素材,UVR还有一点点轻微残留,RX分离出来完全干净,音质几乎和原人声一样,效果确实是顶级的。当然它的价格也很贵,一年订阅要几千块,普通自媒体博主根本没必要,只有专业做音频后期、音乐制作的从业者才需要用到这么高的配置,普通人用UVR就够了。
如果你不想装第三方软件,本身就用Adobe的AU做音频处理,那AU 2023及以后的版本也更新了AI提取人声的功能,你导入音频之后,右键就能找到提取人声的选项,效果比原来的中置提取好很多,如果你已经订阅了AU,直接用就行,不用再装别的工具。还有剪映PC版,也和手机端一样自带消除背景音乐的功能,免费好用,适合用剪映剪视频的小白,效果比手机端好一点,也可以用。
我之前把同一段测试素材,放到所有推荐的工具里处理,得到的效果体验非常清晰,从效果好到差依次是:iZotope RX>UVR(Roformer模型)>Demucs v4>黑狐声音分离>加一人声分离>Lalal.ai>网易天音>剪映>123APPS,价格从便宜到贵依次是:UVR/Demucs(免费开源)>加一人声分离(免费基础功能)>黑狐声音分离(免费基础功能)>剪映(免费)>网易天音(免费额度够用)>123APPS(免费带广告)>Lalal.ai(按次付费)>AU(订阅制)>iZotope RX(高价订阅),大家可以根据自己的需求和预算选。
最后给大家说几个一定要避开的坑,都是我这些年踩过的,给大家提个醒:第一个,不要随便下小网站上不知名的“免费人声分离工具”,很多都是带病毒木马,或者捆绑了一堆广告软件,装完之后电脑卡得不行,还删不掉,还有的偷你电脑里的文件,一定要用我推荐的这些知名工具,靠谱安全。第二个,不要迷信100%完美分离,我前面说了,如果原素材人声小BGM大,或者BGM本身也有人声,任何工具都做不到完美,这种情况别折腾,重新录比什么都强。第三个,分离完人声之后,可以简单做个后期优化,比如加个音量标准化,稍微降一点轻微的残留噪音,能让人声听起来更干净舒服,不用复杂操作,剪映的AI降噪就能搞定。第四个,原创未公开的内容一定要注意隐私,优先选择本地处理或者默认本地存储的工具,别随便用不知名小工具,隐私风险真的要注意,别辛辛苦苦做的内容被别人盗走,得不偿失。
最后给不同需求的朋友做个总结推荐,大家直接对号入座就行:如果你只是偶尔用一次,不想装软件,习惯手机操作,优先试试「加一人声分离」或「黑狐声音分离」这两款微信小程序,打开即用,免费基础功能就能满足需求,国内访问速度快,不用翻墙不用下载;如果你只是偶尔用一次,想用电脑在线工具,选网易天音,免费够用,国内打开快;如果你是手机党,平时手机剪短视频,直接用剪映APP,本身就带功能,免费效果够用;如果你经常需要分离,要求效果好还不想花钱,去下UVR开源工具,本地运行,效果比大部分付费工具还好,完全免费;如果你是专业音频从业者,对音质要求极高,直接上iZotope RX,一分钱一分货,效果就是最好的;如果你对隐私要求极高,不想把音频传给第三方,用本地的UVR或者Demucs,或者选择默认本地存储的「加一人声分离」小程序,安全有保障。
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/4476/