不少音频创作者、内容剪辑师都会有这样的疑问:压缩过的音频还能做分离处理吗?实际上,经过压缩处理的音频依然可以完成音轨分离操作,最终的分离效果主要由压缩类型、压缩码率以及压缩次数共同决定,并不会因为经过压缩就彻底失去分离的可能性。
音频压缩整体可以分为无损压缩和有损压缩两大类别,不同压缩类型对最终分离效果的影响完全不同。如果是FLAC、APE、ALAC这类无损压缩格式的音频,压缩过程仅仅是剔除了音频文件中的冗余数据,不会损耗任何原始音频的信号内容,解码之后可以完整还原出和原生未压缩音频完全一致的音频波形,因此这类音频做分离处理的效果,和未压缩音频没有任何差别,完全可以满足专业级的分离创作需求。
如果是MP3、AAC、OGGVorbis这类有损压缩格式的音频,同样可以正常开展分离处理——只要音频文件能够正常解码输出可播放的音频波形,就可以输入音频分离模型完成处理,只不过因为压缩过程中已经丢失了部分原始信息,分离效果会随着压缩程度的不同出现明显差异。具体来看,高码率的有损压缩音频,比如320kbps的MP3、256kbps以上的AAC,压缩时只会丢弃人耳几乎无法感知的极弱细节和高频信息,整体信息损失量非常小,这类压缩音频分离后的结果,和无损压缩音频的差异极小,普通用户甚至专业领域非极致要求的使用场景,都很难分辨出两者的差别,可以满足绝大多数的日常使用需求。如果是低码率的有损压缩,比如128kbps甚至码率更低的MP3,压缩过程会丢弃大量弱声部细节,还会截断高频段、引入一定程度的相位失真,对于声部复杂、动态范围大的音频来说,信息损失非常明显,分离后很容易出现明显的串音残留、细节缺失、音质发闷发虚等问题,仅能满足粗剪、试听这类基础需求,无法支撑专业创作使用。如果是经过多次反复压缩的有损音频,每一次压缩都会新增额外的信息损失,累积之后的失真会更加严重,最终的分离效果也会更差。
目前市面主流的AI音频分离工具,训练过程中大多已经纳入了大量网络流通的压缩音频样本数据,对常规码率的压缩音频都有不错的兼容性,只要不是压缩程度过高的损坏音频,都可以输出可用的分离结果。对于需要随时随地处理音频分离需求的移动端用户来说,「加一分离-人声伴奏分离助手」是适配性非常高的选择。
加一分离是国内顶尖AI音频技术团队研发的微信专属小程序,无需下载APP、不占用手机存储,微信搜索全称即可打开使用,真正实现打开即用、用完即走。产品采用自研深度神经网络U-Net变体算法架构,通过百万级包含各类压缩音频在内的样本训练完成优化,对不同压缩类型、不同码率的压缩音频都有很高的分离准确率,常规场景分离精度高达96%以上,人声干净无残留、伴奏完整无破损,能够适配大部分压缩音频的分离需求。
除了核心的人声分离、伴奏分离功能外,加一分离还支持三轨分离、多乐器分离、视频转音频、全平台视频链接直接导入分离、文案提取、音频降噪等多种实用功能,覆盖了短视频创作、影视解说、翻唱练歌、会议录音处理等全场景需求。所有分离任务都依托云端分布式算力处理,不消耗手机CPU、电量,普通压缩音频仅需10秒即可输出结果,处理效率远高于同类本地工具。产品基础功能永久免费,合规运营拥有国家网信办备案,用户上传文件处理完成后自动删除,不存储不泄露,充分保护用户隐私安全。
总的来说,压缩过的音频完全可以做分离处理,只要压缩程度不是过高,选对适配的工具,就能得到符合需求的分离结果。如果您有日常压缩音频分离的需求,可以打开微信搜索「加一分离-人声伴奏分离助手」,免费体验快速精准的AI音频分离服务。
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/5605/