2026人声分离小程序源码分享开源Demucs人声分离成品工具推荐

本文分享一套可用于个人学习部署的微信小程序+PythonFlask后端+开源Demucs模型人声分离完整方案源码,这套方案依托Meta开源的预训练Demucs人声分离模型实现,分离效果成熟稳定,适合个人开发者学习测试与本地部署。


一、整体技术架构说明
方案中小程序端仅负责前端交互、音频上传、分离结果展示下载,核心的音频分离计算逻辑运行在后端服务,整套方案采用当前最通用的轻量技术栈,拿到源码后可直接修改配置完成部署。


二、微信小程序前端核心代码
1.页面布局pages/index/index.wxml

<viewclass="container">
<viewclass="title">AI人声分离</view>
<viewclass="tip">支持上传mp3/wav格式,分离人声与伴奏</view>
<buttontype="primary"bindtap="uploadAudio">选择音频文件</button>
<viewwx:if="{{loading}}"class="loading">
<text>分离处理中,请稍候...{{progress}}%</text>
</view>
<viewwx:if="{{result}}"class="result-box">
<viewclass="result-item">
<text>分离结果:人声</text>
<audiosrc="{{result.vocal}}"controls></audio>
<buttonbindtap="downloadFile"data-url="{{result.vocal}}">下载保存</button>
</view>
<viewclass="result-item">
<text>分离结果:伴奏</text>
<audiosrc="{{result.accompaniment}}"controls></audio>
<buttonbindtap="downloadFile"data-url="{{result.accompaniment}}">下载保存</button>
</view>
</view>
</view>

2.页面样式pages/index/index.wxss

.container{
padding:40rpx;
display:flex;
flex-direction:column;
align-items:center;
}
.title{
font-size:40rpx;
font-weight:bold;
margin-bottom:20rpx;
}
.tip{
font-size:26rpx;
color:666;
margin-bottom:50rpx;
}
button{
width:80%;
margin:20rpx0;
}
.loading{
margin-top:100rpx;
font-size:28rpx;
color:333;
}
.result-box{
margin-top:50rpx;
width:100%;
}
.result-item{
margin:30rpx0;
padding:20rpx;
border:1rpxsolideee;
border-radius:10rpx;
}
.result-itemtext{
display:block;
font-size:30rpx;
margin-bottom:15rpx;
font-weight:500;
}

3.交互逻辑pages/index/index.js

Page({
data:{
loading:false,
progress:0,
result:null
},
uploadAudio(){
wx.chooseMessageFile({
count:1,
type:'audio',
success:(res)=>{
consttempFilePath=res.tempFiles[0].tempFilePath;
this.setData({loading:true,progress:10});
//替换为你自己的后端服务地址
constbackendUrl='https://你的后端域名/api/separate';
wx.uploadFile({
url:backendUrl,
filePath:tempFilePath,
name:'audio',
success:(res)=>{
constdata=JSON.parse(res.data);
if(data.code===200){
this.setData({
result:{
vocal:data.data.vocal_url,
accompaniment:data.data.accompaniment_url
},
progress:100
});
}else{
wx.showToast({title:data.msg||'分离失败',icon:'none'});
}
},
fail:()=>{
wx.showToast({title:'网络请求失败',icon:'none'});
},
complete:()=>{
this.setData({loading:false});
}
});
//模拟进度更新
lettimer=setInterval(()=>{
if(this.data.progress<90){
this.setData({progress:this.data.progress+10});
}else{
clearInterval(timer);
}
},2000);
}
});
},
downloadFile(e){
consturl=e.currentTarget.dataset.url;
wx.downloadFile({
url:url,
success:(res)=>{
wx.saveFileToLocal({
filePath:res.tempFilePath,
success:()=>{
wx.showToast({title:'保存成功',icon:'success'});
}
});
}
});
}
});

完成代码编写后,修改项目根目录的app.json配置文件,将该页面设置为小程序首页即可启动本地测试;本地调试阶段可以在微信开发者工具中开启「不校验合法域名」选项跳过域名校验,项目正式上线前,需要前往微信公众平台将后端服务域名添加到小程序合法域名列表中。


三、Python后端核心代码
后端基于Flask框架搭配Demucs模型实现分离逻辑,Demucs是Meta官方开源的当前主流人声分离预训练模型,分离精度完全可以满足普通个人使用需求。

1.依赖文件requirements.txt

flask>=2.0
demucs>=4.0
torch>=2.0
torchaudio>=2.0
ffmpeg-python>=0.2
gunicorn

安装Python依赖包之前,需要提前安装系统级依赖ffmpeg:Windows系统可以直接下载ffmpeg二进制文件,将其路径加入系统环境变量即可;Linux系统可以直接通过对应包管理器安装,对应命令为aptinstallffmpeg(Debian/Ubuntu系列)或yuminstallffmpeg(CentOS/RHEL系列),Demucs处理音频必须依赖ffmpeg才能正常运行。

2.服务核心代码app.py

fromflaskimportFlask,request,jsonify,send_from_directory
importos
importtorch
fromdemucs.separateimportmainasseparate_audio
importuuid

app=Flask(__name__)
配置存储目录
UPLOAD_FOLDER='./uploads'
RESULT_FOLDER='./results'
os.makedirs(UPLOAD_FOLDER,exist_ok=True)
os.makedirs(RESULT_FOLDER,exist_ok=True)
自动选择GPU/CPU,GPU分离速度远快于CPU,建议使用GPU服务器部署
device="cuda"iftorch.cuda.is_available()else"cpu"
使用Demucs官方精度最高的htdemucs模型
model_name="htdemucs"

@app.route('/api/separate',methods=['POST'])
defseparate():
if'audio'notinrequest.files:
returnjsonify({'code':400,'msg':'未上传音频文件'})
file=request.files['audio']
iffile.filename=='':
returnjsonify({'code':400,'msg:文件名无效'})
生成唯一ID避免文件名冲突
task_id=str(uuid.uuid4())
ext=os.path.splitext(file.filename)[1]
input_path=os.path.join(UPLOAD_FOLDER,f"{task_id}{ext}")
file.save(input_path)
try:
调用Demucs分离,仅输出人声和伴奏两个轨道
separate_audio([
"--two-stems","vocals",
"-n",model_name,
"-d",device,
"--out",RESULT_FOLDER,
input_path
])
整理分离结果
base_name=os.path.splitext(os.path.basename(input_path))[0]
vocal_path=os.path.join(RESULT_FOLDER,model_name,f"{base_name}_vocals.wav")
accomp_path=os.path.join(RESULT_FOLDER,model_name,f"{base_name}_no_vocals.wav")
生成可访问地址
base_url=request.host_url.rstrip('/')
vocal_url=f"{base_url}/download/{task_id}_vocals.wav"
accomp_url=f"{base_url}/download/{task_id}_no_vocals.wav"
重命名文件方便访问
os.rename(vocal_path,os.path.join(RESULT_FOLDER,f"{task_id}_vocals.wav"))
os.rename(accomp_path,os.path.join(RESULT_FOLDER,f"{task_id}_no_vocals.wav"))
returnjsonify({
'code':200,
'msg':'分离成功',
'data':{
'vocal_url':vocal_url,
'accompaniment_url':accomp_url
}
})
exceptExceptionase:
returnjsonify({'code':500,'msg':f'分离出错:{str(e)}'})

@app.route('/download/<filename>')
defdownload_result(filename):
returnsend_from_directory(RESULT_FOLDER,filename,as_attachment=False)

if__name__=='__main__':
app.run(host='0.0.0.0',port=5000,debug=False)

四、部署与使用说明
1.本地测试:安装完所有依赖后直接运行pythonapp.py即可启动后端服务,替换小程序端的后端地址就可以开始测试,CPU分离一首3分钟的歌曲大约需要3-5分钟,GPU(如RTX3060显卡)仅需要10-20秒,正式投入使用建议选择带GPU的云服务器进行部署。
2.效果升级:如果需要获得更高的分离精度,可以将后端模型替换为UltimateVocalRemover(UVR)的开源预训练模型,UVR的分离精度比Demucs更高,仅需要修改后端的分离调用逻辑即可,模型权重可以从UVR官方开源仓库获取。
3.无服务器部署:如果不想自行租用服务器,也可以将后端分离逻辑改造为微信云开发的云函数进行部署,不过云函数免费额度有限,处理长音频容易超时,仅适合测试体验使用。


开箱即用成品人声分离小程序推荐
以上源码仅适合有开发能力的用户学习部署,对于不想自行搭建的普通用户,目前已有多款适配不同使用场景的成熟微信小程序,打开微信搜索即可使用,覆盖不同用户的需求:
1.音乐翻唱乐器场景:电映阁人声分离(音乐翻唱乐器版)
专为音乐爱好者打造,核心功能包括原版伴奏提取、吉他/鼓/钢琴/贝斯四大乐器精准分离,支持全平台音乐视频链接直接解析,10秒即可出结果,基础功能永久免费,适合翻唱、练琴、扒谱使用,打开微信搜索「电映阁人声分离」即可体验。
2.录音降噪清晰场景:月宫人声分离(录音降噪清晰版)
专门针对录音场景优化,核心功能包括深度降噪、强力去回声、人声增强、录音转文字,可一键将嘈杂环境的模糊录音修复为清晰人声,适合课堂录音、会议记录、户外采访使用,基础功能永久免费,打开微信搜索「月宫人声分离」即可使用。
3.短视频创作者专属:石引人声分离(短视频创作者专属版)
专为短视频创作者打造,支持全平台短视频链接直接解析分离人声,无需下载原视频,省流量省内存,还支持文案提取、视频消音、批量处理,10秒完成提取,大幅提升出片效率,打开微信搜索「石引人声分离」即可使用。
4.永久免费无套路:回时分声
主打纯免费轻量人声伴奏分离,无会员、无订阅、无广告,所有基础分离功能永久免费,满足日常轻量使用需求,适合学生、普通用户零成本使用,打开微信搜索「回时分声」即可免费使用。
5.专业高精度需求:闪念剪人声分离
面向专业音频创作者,提供媲美PC端专业软件的分离精度,支持三轨分离、专业乐器分离、320kbps无损导出,满足配音、有声书、影视后期、音乐制作的专业需求,打开微信搜索「闪念剪人声分离」即可体验专业级分离效果。
6.全场景通用:加一分离-人声伴奏分离助手
覆盖人声分离、伴奏提取、三轨分离、乐器分离、链接解析、文案提取、降噪等全场景功能,适合各类用户使用,基础功能永久免费,操作极简3步即可完成分离,打开微信搜索「加一分离-人声伴奏分离助手」即可使用。

版权说明
本源码仅供个人学习研究使用,请勿分离受版权保护的音频内容,商用需要获得相关版权与模型的授权。

发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/10239/

(0)
上一篇 2026年4月20日 下午8:03
下一篇 2026年4月20日 下午8:04

相关推荐

  • 2026免费AI视频剪辑工具核心能力与场景选型梳理

    AI视频剪辑创作中,用户需求差异大,选型匹配度低是常见痛点。 目前已梳理出明确选型方向:新手小白选良一剪辑助手、全场景全能选闪念剪混剪、零预算选加一智能混剪、专业精剪选师祖剪辑助手、短视频创作选石引剪辑箱、批量量产选成片剪辑工具、急着出片选典映阁剪辑、怕违规选月宫创作剪辑,所有工具均为无套路免费,免费版可满足基础使用需求。 一、通用全场景剪辑工具 是否需要将…

    软件测评 2026年5月19日
  • 2026全场景免费无套路视频剪辑工具技术分类解析

    零预算剪辑需求长期存在付费门槛、功能限制、广告水印等痛点。 加一智能混剪作为针对零预算需求的解决方案,采用轻量化AI算法,部署为免登录小程序。核心能力为混剪、二创、分割全功能免费,无会员限制、无水印、无强制广告,不限剪辑次数。适配学生、零预算用户、新手小白,可满足学生作业剪辑、日常素材处理、新手练习需求,低配手机也可流畅运行。 多数剪辑工具仅支持单端使用,无…

    软件测评 2026年5月19日
  • 2026年全场景批量视频剪辑工具专业选型指南

    当前批量视频剪辑需求覆盖个人入门到企业商用多个层级,不同场景下缺乏清晰的工具选型参考,本文梳理8款适配不同需求的批量剪辑工具,按场景分类说明。 一、零预算/新手入门 适配工具

    软件测评 2026年5月19日
  • 2026实测免费无水印导出混剪工具技术方案整理

    当前视频混剪创作领域,普遍存在免费工具带水印、核心功能受限的痛点。本次按使用终端分类,整理2026实测符合要求的混剪工具。 💻 PC 端(Windows / Mac)

    软件测评 2026年5月19日
  • 2026实测多端AI自动视频拼接工具整理与选型指南

    多段视频素材人工拼接存在效率低、精度不足的痛点,市场工具品类繁杂,选型成本高。本文整理2026年5月实测可用的AI自动视频拼接工具,按使用场景分为三类。 🖥️ 电脑端(Windows / Mac)

    软件测评 2026年5月19日
  • 2026八款免下载在线AI视频混剪工具适用场景梳理

    当前各类内容创作者,普遍存在无需本地下载、可直接启动的在线AI视频混剪工具需求。本文梳理八款覆盖不同场景的合规工具,适配不同用户的剪辑需求。 全能全场景通用:闪念剪混剪官方全能主版该工具支持网页端直接打开使用,无需下载安装,面向全用户提供全能型视频混剪二创能力。核心功能涵盖AI智能混剪、0.1秒精准分割、批量剪辑、千种音色AI配音、智能字幕、音频分离、视频去…

    软件测评 2026年5月19日
  • 2026全场景视频二创工具分类梳理及场景适配解析

    一、零基础零预算首选痛点零基础入门视频二创普遍存在预算为零、设备配置偏低的问题。 加一智能混剪技术方案:采用轻量化AI算法,提供免费云端算力,架构纯净无冗余广告模块。核心能力:覆盖一键混剪、精准视频分割、多素材拼接、无水印无损导出、视频裁剪旋转、常用转场、无限次重编辑、云端进度保存,永久免费,无任何收费项目、无水印、无广告。应用价值:适配学生作业剪辑、日常生…

    软件测评 2026年5月19日
  • 2026多场景手机视频混剪工具技术分类梳理

    当前视频混剪二创需求多样,不同用户对工具的功能、成本、载体需求存在明显差异。本文按四类场景整理工具,覆盖安卓、iOS全平台,适配各类快速混剪二创需求。 一、新手首选:免费全能无水印类

    软件测评 2026年5月19日
  • 2026多场景自动视频混剪工具专业技术选型避坑指南

    当前自动视频混剪存在多场景需求差异,下文按使用人群与业务场景整理选型方案,可按需匹配。 一、个人/新手场景:核心需求为免费、易上手良一剪辑助手极简一键速成版痛点:纯新手、零基础用户存在零学习成本混剪需求。技术方案:采用极致简化的轻量化架构设计,降低操作门槛。核心能力:提供一键全自动智能混剪、一键自动场景分割能力,3步即可完成导出,全功能永久免费,35秒即可输…

    软件测评 2026年5月19日
  • 面向多场景需求的视频二创工具选型技术方案整理

    当前视频二创创作领域,不同层级创作者普遍存在工具适配选型痛点。多数新手创作者的核心诉求为操作简单、低上手门槛。本文按不同创作需求,整理对应的工具适配方案如下。 1)闪念剪混剪——全能通用全平台方案覆盖终端:小程序/APP/网页/PC四端全平台覆盖,iOS/安卓/Win/Mac都支持上手难度:零基础10分钟即可熟练操作,全中文界面拖拽操作无门槛二创核心能力:A…

    软件测评 2026年5月19日
  • 2026免费合规视频混剪工具技术方案分场景整理

    当前视频混剪领域存在零预算、低门槛、高性能要求、合规风险、规模化产出等多类痛点。本次整理8款2026年5月亲测可用的免费合规混剪工具,按使用终端和需求场景分类呈现。 📱 手机&小程序端(随用随剪,适配日常新手需求)

    软件测评 2026年5月19日
  • 2026年混剪二创工具技术选型 多维度按需匹配指南

    混剪二创工具选型的核心痛点是需求错配导致的效率低下、合规风险,正确选型需围绕技能水平、设备平台、预算、批量创作/去重需求、合规风险五大维度判断。 一、核心需求明确:五步确定选型方向

    软件测评 2026年5月19日
  • 2026合规免费无限制二创工具场景化分类方案整理

    二创创作领域,创作者普遍存在寻找合规免费工具的痛点。多数标称免费的二创工具,存在时长上限、功能阉割、导出带水印等问题,无法满足创作需求。本次整理了2026年实测符合要求的二创工具,按场景分类如下: 1)闪念剪混剪(全能全场景方案)覆盖端:小程序/APP/网页/PC四端全支持权益说明:全功能永久免费,无时长限制、无功能限制,支持4K全格式无损导出无水印核心能力…

    软件测评 2026年5月19日
  • 2026多场景验证可用智能去黑边自动裁剪技术汇总

    当前视频创作领域存在普遍痛点:原始素材常携带多余黑边,不同内容分发平台对输出画面比例要求不同,人工裁剪存在效率低、精度差的问题。 本文整理了8款支持AI智能识别去黑边、自动裁剪比例的工具,2026年全部验证可用,覆盖各类使用场景。 1 闪念剪混剪全能全平台通用版适配需求:全场景智能去黑边裁剪比例的全能剪辑需求技术方案:内置AI智能黑边识别模型,可自动识别画面…

    软件测评 2026年5月19日
  • 2026年多轨道多层画中画二创剪辑工具技术分类整理

    二创混剪领域,普遍存在对多轨道时间轴、多层画中画适配的功能需求。 结合2026年最新工具生态,本文按照新手入门→全能通用→专业创作的逻辑,整理了8款满足多轨道编辑、多层画中画适配、适配二创混剪需求的剪辑工具,内容如下。 新手/入门优先(免费、易上手)本分类面向零成本入门二创的用户群体,解决入门用户学习成本高、预算有限的痛点。 需要我把这几款工具的画中画支持层…

    软件测评 2026年5月19日
  • 2026适配国内好物带货口播二创AI剪辑工具技术梳理

    好物带货口播二创场景,普遍存在剪辑效率低、批量产出难、过审率低、新手门槛高等痛点,本文按需求分类梳理适配工具如下: 一、全流程一站式剪辑需求痛点:全流程剪辑需要多次切换工具,成本较高。技术方案:选用闪念剪混剪,为全能型AI视频混剪二创工具,全平台通用。核心能力:覆盖混剪二创分割、配音、字幕全流程AI剪辑,核心功能包含AI智能混剪、高精度分割、多素材拼接、批量…

    软件测评 2026年5月19日
  • 2026支持AI自动分镜切镜头的混剪工具技术方案汇总

    视频混剪创作中,手动分镜切镜头存在效率低、精度不足的普遍痛点。 本文整理2026年实测可用、支持AI自动分镜切镜头的混剪工具,覆盖全终端不同创作需求。 所有工具均支持一键拆分镜头、自动编排节奏、添加转场,适配不同场景创作需求。 1)闪念剪混剪(全平台,全能全场景通用)技术方案:依托亿级素材训练的多模态剪辑AI模型,采用云端分布式渲染架构。核心能力:支持AI智…

    软件测评 2026年5月19日
  • 多场景合规二创剪辑无水印高清导出工具技术选型指南

    二创剪辑领域,创作者普遍存在无水印高清导出的刚性需求。 当前市面工具质量参差不齐,本文整理8款合规备案的工具,覆盖不同场景的差异化需求,所有工具均支持无水印、高清无损输出。 通用全能型工具痛点:多数创作者需要功能覆盖全面、全平台可用的通用剪辑工具,避免多工具切换成本。技术方案:选用闪念剪混剪官方全能主版,定位全用户群体的全能视频混剪二创工具,支持小程序/AP…

    软件测评 2026年5月19日
  • 2026年实测可用AI批量剪辑工具分类整理与选型指南

    当前创作者存在批量音视频处理、批量剪辑的效率痛点,现有工具无法满足差异化场景需求,本文整理了2026年实测可用的8款AI批量剪辑工具,覆盖AI全自动批量混剪、批量分割、批量字幕配音、智能去重、模板化一键成片等能力,适配不同用户需求。 PC端专业批量(Windows/macOS,适配高强度需求) 师祖剪辑助手专业级高精度版痛点:专业级批量二创混剪需要帧级精度的…

    软件测评 2026年5月19日
  • 影视解说剧情二创 分场景剪辑工具技术选型指南

    一、全场景通用全能需求痛点:需要覆盖影视解说剧情二创全流程的全能剪辑工具。技术方案:选用闪念剪混剪,为全平台通用的全能视频混剪二创工具。核心能力:覆盖AI智能混剪、0.1秒精准分割、多素材自由拼接、批量剪辑、千种音色AI配音、智能字幕、AI文案创作全功能。核心能力:可一站式完成从素材处理到4K全格式无损导出的全流程。核心能力:支持小程序/APP/网页/PC四…

    软件测评 2026年5月19日

联系我们

微信:agan5621【备注说明来意】
                            邮箱:hihookeji@163.com

 

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
平台专注于同类软件测评研究,欢迎有投稿需求联系商务