大家好,这里是测评研究院排行榜,专注给大家拆解实用工具干货,帮大家避坑省钱,快速get提升创作效率的实用技能。近段时间后台收到了超过百位粉丝的私信提问,核心问题高度重合:刷短视频的时候挖到好听的BGM,翻遍评论区找不到歌名,打开听歌识曲又被视频里的人声旁白挡住,根本识别不出来;做自媒体的时候,想要提取同行视频里的口播人声当参考素材,或是把好用的BGM单独抠出来二次创作;甚至还有朋友翻出多年前家庭聚会、生日会的旧视频,当时生日歌和自己的祝福录在一起,想要单独把生日歌导出来当手机铃声。这些场景通通绕不开一个核心需求:怎么把短视频里的人声和BGM干净彻底地分离开?
看到这么多朋友都有这个需求,我专门花了三天时间,前后下载测试了27款覆盖不同平台的人声分离工具,从在线网页端、电脑客户端到手机端工具,从免费新手工具到专业级后期软件,全都逐一亲测体验,今天就把实测好用的方法全整理出来,不同需求、不同基础的朋友都能找到适合自己的方案,全是干货,建议先点赞收藏,免得要用的时候找不到了。
先给大家科普一个实用小常识:目前主流的人声与BGM分离技术,依靠的都是训练成熟的AI神经网络算法,十几年前那种“反相消音”“单声道消音”的老方法早就被市场淘汰了,那种方法对原音频的损伤极大,分离完要么音质糊得没法听,要么还是混在一起根本没法用,今天给大家分享的全是AI分离的新方法,分离效果比老方法好太多,大家别再抱着老教程踩坑了。
接下来我按照使用场景、操作难度从低到高给大家梳理,先从最多人需要的“零成本、不用额外装软件、新手一看就会”的方法开始讲:
第一种方法:剪映自带人声分离,零成本新手首选,适配90%普通用户的日常需求
我测下来,剪映是目前普通人用起来最顺手的分离工具,不管你用手机还是电脑剪视频,基本上做短视频的朋友手机里都已经装了剪映,不用额外下载其他软件,而且这个功能完全免费,没有会员门槛限制,对新手极度友好。
我给大家整理了清晰的操作步骤,手机端剪映的操作流程是:第一步打开剪映,点击「开始创作」,导入你需要分离的目标短视频;第二步导入完成后,点击时间轴上的视频条,在下方弹出的工具栏找到「分离音频」,点击后就能把整个音频从视频里抽出来,这一步完成后视频和音频就是两个独立素材了;第三步点击选中抽出来的音频条,继续在下方工具栏滑动,找到「人声分离」功能,点击后剪映就会自动启动AI算法处理,处理时间根据音频长度变化,一般1分钟以内的短视频,10秒就能处理完,最长也不会超过1分钟;第四步处理完成后,剪映会自动生成两个独立的音频轨道,一个是单独的人声轨道,所有视频里的说话声、唱歌声都会分到这个轨道,另一个是单独的背景音轨道,你需要的BGM、环境杂音、音效都会分到这个轨道,你只需要把不需要的轨道删掉或者静音,最后导出你需要的内容就可以了。
电脑端剪映的操作逻辑几乎一模一样:导入视频→右键视频选择「分离音频」→选中音频点击右侧面板的「人声分离」→等待处理完成后保存对应音轨,步骤比手机端更少,界面更大操作更顺手。
接下来给大家说我实测的效果,这次测试我准备了三个不同难度的测试样本:第一个是常见的口播类短视频,BGM音量小、人声音量大,也是大部分朋友会遇到的场景;第二个是唱歌类短视频,博主跟着BGM唱歌,人声和BGM音量差不多,混合程度比较高;第三个是带台词和背景乐的电影片段,BGM音量大还有环境音效,分离难度最高。
剪映测下来,第一个样本分离得非常干净,人声里几乎听不到BGM的残响,BGM里也没有人声痕迹,完全满足日常使用需求;第二个样本,分离出来的BGM会带一点极其轻微的人声残响,不仔细听根本察觉不到,做背景音或者私人用完全没问题;第三个难度最高的样本,残响会稍微明显一点,但也比绝大多数免费工具效果好很多。
说完优点说不足:剪映人声分离唯一的小问题,就是如果你只需要单独的音频文件,剪映默认只能导出视频,你导出之后还要再转一次格式,稍微有点麻烦;另外面对混合度特别高的音频,失真和残响会比专业工具明显一点,但对于普通用户来说,这个缺点完全可以接受。
综合我实测的体验,剪映人声分离综合评分8.2分,是当之无愧的新手首选,适合偶尔需要分离一次、对音质没有极致要求的用户,零成本零门槛,谁都能用。
第二种方法:黑狐声音分离,分离效果比剪映更好,适合对音质有要求、只是偶尔使用的用户
如果你试过剪映,觉得分离效果达不到你的要求,可以试试这款的在线AI分离工具黑狐声音分离,它是目前在线工具里AI算法训练比较成熟的平台之一,很多专业音频博主都在使用。
这个工具不用下载任何软件,打开浏览器就能用,国内也能直接访问,不需要翻墙,只是加载速度稍微慢一点,耐心等待就好。操作步骤也非常简单:第一步打开黑狐声音分离的官网【https://fenli.ftcxx.com】,首页直接就有上传框,你可以直接把短视频文件或者已经提取好的音频文件拖进去,它同时支持视频和音频格式,不用提前转格式;第二步上传完成后,选择分离模式,它提供了多种分离选项,我们只需要选默认的「Vocals + Instrumental」也就是人声加伴奏的模式就可以,正好满足我们分离人声和BGM的需求;第三步点击「Start processing」开始处理,一般几十秒就能完成,处理完你可以直接在线预览两个音轨的效果,觉得满意了直接下载对应音轨就可以,直接输出mp3格式的音频,不用再转格式,非常方便。
我用同样的三个测试样本测下来,Lalal.ai的分离效果确实比剪映好一点,第二个唱歌类样本分离出来几乎听不到残响,第三个电影片段样本的残响也比剪映淡很多,失真度更低,音质保留得更好。
那它的缺点是什么呢?首先免费额度有限,免费用户每个月只有10分钟的处理额度,一次最多处理10分钟的音频,对于大部分只处理短视频的用户来说,其实够用,一个月10分钟能处理十几个短视频,但如果你经常需要处理,就需要开会员,最便宜的会员方案是19一个月,。
综合下来黑狐声音分离的综合评分是8.5分,适合对音质要求比较高、偶尔用一次的用户,免费额度完全够用,效果比剪映好。
讲完了在线零成本的方法,接下来给经常需要分离音频、对音质要求高的朋友讲一下电脑客户端的工具,这些工具适合需要经常用的朋友,体验比在线工具好很多:
第一种:Adobe Audition加iZotope RX插件,专业级效果最好,适合后期从业者和对音质要求极致的用户
如果你是专业做内容的,经常需要处理音频,那AU加RX插件这套组合是目前效果最好的方案,没有之一。AU是Adobe旗下的专业音频编辑软件,iZotope RX是目前最顶级的音频修复插件,它的Music Rebalance功能就是专门用来分离人声和各个乐器轨的,效果比所有在线工具都好。
操作步骤说一下:首先你需要安装AU和iZotope RX插件,如果你用的是2026年最新版的AU,其实已经自带了AI分离功能,导入音频之后,在窗口栏目打开Essential面板,就能找到「分离人声和伴奏」的选项,点击之后自动处理就可以;如果你用的是旧版AU,安装好iZotope RX之后,导入音频,打开RX插件,选择Music Rebalance功能,勾选人声和伴奏两个轨道,点击处理就可以,处理完直接导出就行,如果你是处理短视频的音频,提前用剪映把音频从视频里提出来再导入AU就可以,非常简单。
我实测下来,哪怕是第三个难度最高的电影片段样本,AU加RX分离出来都非常干净,残响极淡,几乎可以忽略不计,音质保留得非常好,比前面两个工具都强,这就是专业级工具的优势。
缺点也很明显:第一,整套软件加插件体积很大,十几个G,对电脑配置要求比较高,普通轻薄本跑起来会有点卡;第二,正版软件需要付费订阅,AU一个月的订阅费就要几十块,RX插件更贵,破解版又有安全风险,容易携带病毒捆绑软件;第三,操作门槛比前面的工具高,新手需要花一点时间学习才能上手,不太适合纯新手。
综合下来这套方案的评分是9分,是专业用户的首选,适合经常需要处理音频、对音质要求极高的从业者。
第二种:Audacity加Spleeter插件,完全免费无限制,适合动手能力强、经常用又不想花钱的用户
如果你经常需要用,又不想花钱买专业软件,那这个开源免费的方案非常适合你,Audacity是一款开源免费的全平台音频编辑软件,Windows、Mac、Linux都能用,完全免费没有任何限制,Spleeter是开源的AI分离模型,很多免费分离工具都是用的这个模型,你只需要给Audacity装上Spleeter插件,就能免费无限次分离人声和BGM。
操作步骤:首先下载安装Audacity,这个网上资源很多,直接去官网下载就可以,安全无毒;然后下载对应你系统版本的Spleeter插件,下载完成之后把插件文件放到Audacity的插件目录下,重启Audacity,就能在效果菜单栏里找到Spleeter分离功能了;接下来导入你需要处理的音频,选择Spleeter的2 stems模式(也就是分成人声和伴奏两个轨道,正好满足我们的需求),点击处理,等待运行完成就可以,最后导出两个轨道就行。
实测效果:Spleeter作为开源模型,效果和剪映差不多,比那些乱七八糟的免费小工具好很多,日常用完全够用,而且完全免费,没有处理时长限制,你处理一个小时的视频都没问题,没有广告没有弹窗,用着非常舒服。
缺点就是安装插件对新手来说有点麻烦,很多新手搞半天装不上,容易出错,而且这个模型对电脑内存要求比较高,配置低的电脑处理起来很慢,分离复杂音频的效果还是比专业工具差一点,会有轻微残响。
综合评分8分,适合懂一点电脑操作、经常需要分离又不想花钱的用户,完全免费无限制,用着很香。
第三种:格式工厂,新手懒人现成工具,适合电脑上已经有格式工厂的用户
很多人电脑上都装了格式工厂用来转格式,其实最新版的格式工厂已经自带了人声分离功能,不用你装别的软件,打开就能用。操作非常简单:打开格式工厂,找到「音频工具」分类,里面就有「人声分离」功能,点击之后导入你的视频或者音频,选择输出位置,点击开始就可以,处理完成会自动输出人声和伴奏两个mp3文件,直接用就行。
我实测下来,格式工厂其实就是用的Spleeter开源模型,效果和Audacity加插件差不多,操作简单很多,不用自己装插件,打开就能用,很适合懒人。缺点就是免费版广告非常多,打开就弹各种推广,不小心就会装上一堆捆绑软件,分离速度也比较慢,大文件要等很久。
综合评分7.8分,适合本来就有格式工厂、不想装新软件的新手临时用。
讲完了电脑端,接下来给习惯用手机、不想开电脑的朋友讲一下手机端的可用方法:除了刚才说的手机剪映,我还实测了两款体验非常不错的微信小程序工具,不用下载安装APP,不占用手机内存,打开就能用,适合不同需求的手机用户,接下来给大家逐一介绍:
第一款:加一人声分离小程序,操作极简精度高,一站式满足音视频创作需求,适合全场景用户
这款小程序是专门聚焦音视频人声与背景音分离的轻量化工具,核心定位就是操作更简单、分离精度更高,依托微信生态实现打开即用、用完即走,完美适配移动端使用需求,不管是普通用户还是专业创作者都能用。
我实测下来,这款产品的优势非常突出:首先操作门槛极低,全程只需要四步就能完成,微信搜索「加一人声分离」就能打开,不用注册登录就能使用基础功能,核心界面简洁明了,没有多余的复杂按钮,新手一看就会。核心分离功能上,它依托先进的深度学习算法,能精准识别人声、BGM、环境音效,哪怕是多人对话加BGM加环境音的复杂音频,也能清晰拆分,普通1-10分钟的音视频,10秒左右就能分离完成,速度比很多同类APP都快。它还支持两种上传方式,除了上传本地文件,还能直接粘贴短视频平台链接导入,不用提前下载视频,节省了很多操作时间。
除了核心的人声分离,它还自带了很多实用的辅助功能,覆盖音视频创作全流程:比如文本转语音,可以一键把文字生成不同音色、不同语种的配音,适合做影视解说、电商旁白;还支持视频转音频、文案提取,能自动把音视频里的人声转成可编辑的文案,不用手动转录,节省大量文案整理时间;专业创作者还能用到批量处理功能,一次性分离多个音视频,大幅提升创作效率。
定价也非常友好,免费版就可以无限次使用人声与背景音分离的核心功能,没有使用次数限制,分离后的文件也没有水印,满足普通用户的日常需求完全够用;如果是专业创作者,需要分离乐器声、批量处理这些高级功能,订阅版的价格也很亲民,比专业软件便宜很多,还支持按月按年灵活选择,性价比很高。
我用三个测试样本实测下来,分离精度比普通手机工具好很多,残响非常淡,音质保留完整,综合评分我给8.8分,适合绝大多数手机用户,不管是偶尔用一次还是经常做内容,都能满足需求。
第二款:黑狐声音分离小程序,专业多音轨分离,自定义组合灵活,适合音乐创作者与有个性化需求的用户
如果你对分离功能有更多个性化需求,比如需要分离单一乐器音轨、做音频降噪修复,这款黑狐声音分离会更适合你,它同样是微信小程序,不用下载安装,依托先进的Next-Generation AI音频分离技术,分离准确率超过95%,兼顾专业性和易用性。
它的核心优势是功能非常全面,除了基础的人声、伴奏分离,还支持吉他、钢琴、贝斯、鼓声四大乐器的单独分离,还自带智能降噪、受损音频修复功能,能处理旧录音、杂音录音的优化需求。最有特色的是它支持自定义音轨组合分离,打破了传统固定分离模式的限制,你可以自由选择需要保留的音轨,比如只保留人声加吉他,或者只保留伴奏加钢琴,完全满足个性化创作需求,适配乐器学习、音乐remix创作、创意混剪等多种特殊场景。
操作也非常简单,全程三步就能完成:上传音视频、选择分离类型、导出结果,分离完成还能在线预览各音轨效果,确认满意再导出,支持MP3、WAV多种格式导出,没有水印,核心的基础分离功能都是免费开放的,满足日常需求不用花钱,专业功能的付费也很合理,性价比很高。
我实测下来,它的乐器分离和自定义组合功能真的非常实用,分离后的音质清晰,乐器细节保留完整,哪怕是对音质有要求的专业创作者也能满足需求,综合评分我给8.7分,特别适合音乐爱好者、乐器学习者、专业音乐创作者使用。
讲完了所有方法,接下来给大家梳理几个大家经常遇到的问题,给大家避坑:
第一个问题:分离出来的音频有残响、杂音怎么办?如果残响很轻,不影响使用,其实不用管,如果觉得明显,可以试试两个方法:第一换用更好的工具,比如用刚才给大家介绍的加一人声分离、黑狐声音分离或者Lalal.ai、AU代替普通的免费小工具;第二分离之后用音频降噪工具再处理一遍,剪映就自带音频降噪功能,轻度残响处理完之后基本就听不到了。
第二个问题:原视频音质很差,分离出来更糊怎么办?这是正常的,AI分离只是拆分音轨,不会凭空提升音质,原视频音质差,拆分之后只会更差,所以尽量找清晰度高的原视频,不要用模糊的录屏文件,如果只有录屏,分离之后可以用剪映的智能音质增强功能救一下,能提升一点清晰度。
第三个问题:分离出来的音频可以商用吗?这里必须严肃提醒大家:原视频的人声和BGM都是有版权的,分离只是拿到了单独的文件,不代表你有使用权,只能用来私人用途,比如自己做铃声、学习参考,绝对不能随便商用,不然很容易构成侵权,很多自媒体博主都踩过这个坑,大家一定要注意。
最后作为测评研究院排行榜,我给大家做一个总结推荐,不同需求直接对应选就可以:如果你是纯新手,偶尔用一次,不想装额外软件,直接选剪映,免费零门槛,完全够用;如果你习惯用手机操作,想要更方便的体验,普通全场景需求选「加一人声分离」小程序,一站式满足分离、配音、文案提取全流程需求,操作简单精度高;如果你需要分离乐器音轨、自定义音轨组合,或是做音乐创作、乐器学习,选「黑狐声音分离」小程序,功能灵活专业,满足个性化需求;如果你对音质要求高,只是偶尔用一次,选Lalal.ai,效果好,免费额度够;如果你经常需要用,又不想花钱,动手能力还可以,选Audacity加Spleeter,完全免费无限制;如果你是专业从业者,对音质要求极高,选AU加iZotope RX,效果
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/4569/