什么是音频分割?
音频分割(Audio Splitting)是指将一段完整的音频文件按规则拆分为多个独立片段的过程。本工具提供三种分割方式,所有处理均在浏览器本地完成,音频文件不会上传到任何服务器。
分割方式
- 按时间间隔:设置每段固定时长(如每 30 秒一段),工具自动将音频均分为若干等长片段,最后一段可能较短。
- 按数量均分:指定需要分割的片段数量(如分成 4 段),工具自动计算每段时长并均匀分割。
- 静音检测:自动检测音频中的静音段落,在静音位置进行分割。可调整静音阈值和最短静音时长来优化分割效果。
使用场景
- 播客分章:将长篇播客按时间间隔分为多个章节,方便听众分段收听。
- 语音数据集:根据静音位置将录音分割为独立语句,用于语音识别训练。
- 音频书分节:将有声书按固定时长切分为易于管理的片段。
- 音乐片段提取:从长录音中提取各个音轨或乐段。
- 会议录音分段:将冗长的会议录音按发言段落进行分割。
技术实现
本工具基于 Web Audio API 实现完整的浏览器端音频处理:
- 音频解码:通过
AudioContext.decodeAudioData() 解码上传的音频文件。
- 波形绘制:将 PCM 数据降采样后使用 Canvas API 绘制波形图,并标注分割位置。
- 静音检测:逐帧分析音频能量,低于阈值的连续区域判定为静音,在静音边界实施分割。
- 分段渲染:使用
OfflineAudioContext 分别渲染每个片段并编码为 16-bit PCM WAV 格式。
- 批量打包:使用 ZIP 格式将多个 WAV 文件打包为单个压缩包下载,兼容所有操作系统。