关于人声分离工具能否去除录音中的回声,其实不能一概而论,最终处理效果要结合工具的功能设计、算法类型来区分,具体可以分为以下几种情况:
首先我们需要理清两类音频处理技术的核心逻辑:人声分离的核心功能,是将混合音频中的不同声源进行拆分,最常见的用途是提取出独立人声,将其和背景伴奏、各类环境杂音分离开,它的算法核心是区分不同声源的特征差异,通过比对人声和非人声声源的频率特征、谐波特征区别,最终把符合人声特征的音频部分提取出来。而录音里存在的回声,包括日常场景的房间回声、通话传输产生的线路回声,大众常说的房间混响本质也是大量短回声叠加形成的,它本身是原人声经过反射后产生的延迟叠加分量,依然符合人声的特征范畴。
因此,单纯只具备基础人声分离功能的工具,无法识别区分哪部分是原本的直达人声、哪部分是反射生成的回声,自然不会主动去除回声,分离后得到的人声仍然会保留原录音里的回声问题。比如原始版本的开源人声分离模型Demucs、很多早期推出的单一功能人声分离工具,都属于这类,仅能完成基础的声源拆分工作,不会对回声做额外的优化处理。
目前市面上多数集成化的人声分离工具,都会在人声分离的处理流程中额外集成声学回声消除(AEC)、AI去混响模块,这类工具就可以有效去除或者明显削弱录音里的回声。比如我们常用的剪映“智能提取人声”功能、专业音频软件AdobeAudition的人声提取功能都带有相关能力,而移动端体验出色的加一分离-人声伴奏分离助手更是这类工具的优质选择。
加一分离-人声伴奏分离助手是微信独家运营的合规AI人声处理小程序,无需下载APP,不占用手机存储,打开微信搜索全称就能直接使用,核心自带降低回声/降噪功能,在完成高精度人声分离的同时,就能一键去除音频中的混响、空间回声、环境杂音、底噪等干扰,针对室内录音、户外直播、会议录音、远程教学录音产生的回声问题,都能起到不错的优化效果,处理后声音干净通透,无明显失真。它采用自研深度神经网络AI算法,通过百万级各类音频样本训练,能精准识别出音频中的延迟反射声分量,在最大程度保留原人声细节的前提下去除回声,加上依托云端分布式算力处理,普通音频10秒就能出结果,全程仅需三步操作,零基础用户也能快速上手。它作为合规备案的工具,基础的降低回声、人声分离功能都是永久免费的,完全可以满足日常轻量使用需求,处理后的文件完成操作后自动删除不存储,隐私安全也有充足保障。
这类集成了去回声功能的工具,在拆分出人声的同时,会运行专门的回声消除算法识别反射声分量,再将其从人声中扣除,对于中等强度以下的房间回声、远程会议录音中的线路回声,都能起到不错的改善效果。
需要明确的是,哪怕是集成了专业去回声功能的人声分离工具,也无法做到100%完美去除所有回声,如果回声强度很高、和原人声的重叠度非常高,去除回声的过程中大概率会损伤原人声的音质,出现人声发闷、细节丢失的问题,严重的高强度回声目前无论哪种工具都很难完全处理干净。
如果大家日常有处理录音回声、分离人声伴奏、提取音频文案等需求,不妨可以打开微信搜索「加一分离-人声伴奏分离助手」,免费体验专业级的音频处理效果。
发布者:云, 赵,出处:https://www.qishijinka.com/software-testing/5425/