为什么在线转录服务违反了保密协议 (NDA)
律师、记者、人力资源经理和播客主经常录制包含敏感信息的会议、采访和证词。当你使用 Otter.ai ($15/月)、Sonix ($22/月) 甚至 OpenAI Whisper API 时,你的音频会被上传到远程服务器进行处理。即使这些公司承诺对数据加密,你的录音在物理上也依然存在于一个你不受控制的服务器上。
对于任何受 NDA、律师-客户特权、HIPAA 或 GDPR 约束的组织来说,这都是重大的违约风险。解决方案显而易见:在客户端自己的硬件上运行 AI 模型,这样音频就永远不会离开设备。
How Whisper.js Works in Your Browser
- ONNX Runtime: Whisper 模型被转换为 ONNX 格式,并通过 ONNX Runtime Web 运行,它会利用您的 GPU(通过 WebGPU/WebGL)或 CPU。
- 模型缓存: ~40MB 的模型从 Hugging Face 下载一次后,将存储在浏览器的 IndexedDB 中。后续使用将瞬间加载。
- 音频处理: 音频通过 Web Audio API 解码,重采样为 16kHz 单声道,并在浏览器内存中分 30 秒片段处理。
常见问题 (FAQ)
我的音频会被上传到服务器吗?
不会。Whisper AI 模型完全通过 Transformers.js 和 ONNX Runtime 在您的浏览器中运行。您的音频在您的 GPU/CPU 上本地处理。
它对于法律录音而言符合 NDA 安全要求吗?
符合。由于所有处理都在您的设备本地进行,因此不传输任何数据。与 Otter.ai 或 Sonix 不同,您的机密会议录音不存在被存储在第三方服务器上的风险。
转换的准确率有多高?
此工具使用的是 OpenAI 的 Whisper 模型,在英语和许多其他语言中都能达到接近人类的准确率。浏览器版本使用的是 'tiny' 变体模型以换取快速性能,准确率可能比完整模型略低。
