零信任 AI 音频转录器

为什么在线转录服务违反了保密协议 (NDA)

律师、记者、人力资源经理和播客主经常录制包含敏感信息的会议、采访和证词。当你使用 Otter.ai ($15/月)、Sonix ($22/月) 甚至 OpenAI Whisper API 时，你的音频会被上传到远程服务器进行处理。即使这些公司承诺对数据加密，你的录音在物理上也依然存在于一个你不受控制的服务器上。

对于任何受 NDA、律师-客户特权、HIPAA 或 GDPR 约束的组织来说，这都是重大的违约风险。解决方案显而易见：在客户端自己的硬件上运行 AI 模型，这样音频就永远不会离开设备。

How Whisper.js Works in Your Browser

ONNX Runtime： Whisper 模型被转换为 ONNX 格式，并通过 ONNX Runtime Web 运行，它会利用您的 GPU（通过 WebGPU/WebGL）或 CPU。
模型缓存： ~40MB 的模型从 Hugging Face 下载一次后，将存储在浏览器的 IndexedDB 中。后续使用将瞬间加载。
音频处理： 音频通过 Web Audio API 解码，重采样为 16kHz 单声道，并在浏览器内存中分 30 秒片段处理。

常见问题 (FAQ)

我的音频会被上传到服务器吗？

不会。Whisper AI 模型完全通过 Transformers.js 和 ONNX Runtime 在您的浏览器中运行。您的音频在您的 GPU/CPU 上本地处理。

它对于法律录音而言符合 NDA 安全要求吗？

符合。由于所有处理都在您的设备本地进行，因此不传输任何数据。与 Otter.ai 或 Sonix 不同，您的机密会议录音不存在被存储在第三方服务器上的风险。

转换的准确率有多高？

此工具使用的是 OpenAI 的 Whisper 模型，在英语和许多其他语言中都能达到接近人类的准确率。浏览器版本使用的是 'tiny' 变体模型以换取快速性能，准确率可能比完整模型略低。