好用的语音转文字工具,离线免费使用
语音识别技术(ASR)在提升人机交互体验方面扮演着关键角色。它广泛应用于多种场景,包括但不限于:语音转录、多语言翻译、实时听写、语音到文本的合成、关键词检索、语音日记记录以及语音信号的增强处理等。
语音识别的常规流程通常涉及以下几个步骤:音频信号的采集与分析、音频数据的分解、格式的转换以及与文本的匹配。
然而,一个成熟的语音识别系统往往更为复杂,它可能包含额外的步骤和功能模块,如背景噪声的抑制、声学特征的建模、语言规则的建模以及对识别结果的置信度评估等。
今天给大家推荐一款可离线运行的语音识别软件,不仅可以将录音转为文字,还可以实时识别语音,并且开箱即用,免费使用。
  软件介绍    
Buzz 是一款可以离线运行的语音识别软件。它有两个功能,一个是录音转文字,一个是实时语音识别。它的底层还是使用 whisper 的语音识别功能。不过它的优点是你只需要下载一个安装包,安装好之后就可以直接运行,不像配置 whisper 那样麻烦。 

好用的语音转文字工具,离线免费使用

  软件特点    

Buzz 底层依然使用了whisper 的语音识别功能,不过简化了安装过程,只需要下载一个安装包就可以离线使用了。

  • 离线运行能力:Buzz 可以在没有网络连接的情况下使用,为用户提供了灵活性。

  • 双重功能:它具备录音转文字和实时语音识别两种功能,满足了不同场景下的需求。

  • 简化的安装过程:用户只需下载一个安装包并安装,即可直接使用 Buzz,无需进行复杂的配置。

  • 底层技术依托:Buzz 的语音识别功能基于 whisper 技术,确保了识别的准确性和可靠性。

  • 用户友好性:相较于配置 whisper,Buzz 提供了更为简便的用户体验。

  软件安装部署    

Buzz  支持跨平台运行,支持 macOS、Windows 和 Linux 操作系统。每个平台的安装方式如下:

macOS 操作系统:

brew install --cask buzz
Windows 操作系统:

从项目仓库下载 exe 安装包,安装后就可以使用。

好用的语音转文字工具,离线免费使用

Linux 操作系统:

sudo apt-get install libportaudio2 libcanberra-gtk-module libcanberra-gtk3-modulesudo snap install buzzsudo snap connect buzz:audio-recordsudo snap connect buzz:password-manager-servicesudo snap connect buzz:pulseaudiosudo snap connect buzz:removable-media


此外,Buzz 还支持通过PyPI 安装:

pip install buzz-captionspython -m buzz

  使用展示    

好用的语音转文字工具,离线免费使用 录音转文字功能:

好用的语音转文字工具,离线免费使用

运行Buzz 软件后,直接将录音文件拖入 Buzz 窗口,就会出现上面的弹窗,在第一次转录时会下载模型,后面就可以离线运行了。在下面的设置中,还可以自定义导出文本格式,比如 txt,SRT,VTT 等。

好用的语音转文字工具,离线免费使用 现场录制功能

点击 麦克风 图标,就会弹出现场录制窗口。再点击 录制 按钮就可以开启现场录制,实时将语音转为文字记录下来。和录音转文字一样,在第一次转录时会下载模型,后面就可以离线运行了。

好用的语音转文字工具,离线免费使用

  小结一下    

Buzz 是一款可以离线运行的语音识别软件,底层使用了 whisper 的语音识别功能,具备录音转文字和实时语音识别的能力,而且还具备多平台支持、安装方便、免费使用等诸多特点。

更多详细内容,可以到项目仓库查看,项目地址:
https://github.com/chidiwilliams/buzz

© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...