软件特点
Buzz 底层依然使用了whisper 的语音识别功能,不过简化了安装过程,只需要下载一个安装包就可以离线使用了。
-
离线运行能力:Buzz 可以在没有网络连接的情况下使用,为用户提供了灵活性。
-
双重功能:它具备录音转文字和实时语音识别两种功能,满足了不同场景下的需求。
-
简化的安装过程:用户只需下载一个安装包并安装,即可直接使用 Buzz,无需进行复杂的配置。
-
底层技术依托:Buzz 的语音识别功能基于 whisper 技术,确保了识别的准确性和可靠性。
-
用户友好性:相较于配置 whisper,Buzz 提供了更为简便的用户体验。
软件安装部署
Buzz 支持跨平台运行,支持 macOS、Windows 和 Linux 操作系统。每个平台的安装方式如下:
macOS 操作系统:
brew install --cask buzz
从项目仓库下载 exe 安装包,安装后就可以使用。
Linux 操作系统:
sudo apt-get install libportaudio2 libcanberra-gtk-module libcanberra-gtk3-module
sudo snap install buzz
sudo snap connect buzz:audio-record
sudo snap connect buzz:password-manager-service
sudo snap connect buzz:pulseaudio
sudo snap connect buzz:removable-media
此外,Buzz 还支持通过PyPI 安装:
pip install buzz-captions
python -m buzz
使用展示
录音转文字功能:
运行Buzz 软件后,直接将录音文件拖入 Buzz 窗口,就会出现上面的弹窗,在第一次转录时会下载模型,后面就可以离线运行了。在下面的设置中,还可以自定义导出文本格式,比如 txt,SRT,VTT 等。
现场录制功能
点击 麦克风 图标,就会弹出现场录制窗口。再点击 录制 按钮就可以开启现场录制,实时将语音转为文字记录下来。和录音转文字一样,在第一次转录时会下载模型,后面就可以离线运行了。
小结一下
Buzz 是一款可以离线运行的语音识别软件,底层使用了 whisper 的语音识别功能,具备将录音转文字和实时语音识别的能力,而且还具备多平台支持、安装方便、免费使用等诸多特点。