【大模型】开源且可商用的大模型通义千问-7B（Qwen-7B）来了-武穆逸仙 In October 2024

点击上方壹家大数据，关注后发现更多精彩内容

数据来源：https://github.com/trending，后台回复 230101，获取 github 爬虫

免费提供 github 热搜历史数据，后台回复邮箱即可

名称: /QwenLM/Qwen-7B

地址: https://github.com/QwenLM/Qwen-7B

fork: 89 star: 1,592 开发语言: Python

项目简介: The official repo of Qwen-7B (通义千问-7B) chat & pretrained large language model proposed by Alibaba Cloud.

在时间的冲蚀下，许多照片都失去了原本的色彩。然而在老照片修复的过程中，专业度要求很高的 PS 工具，对大部分人来说上手太难了。在文字聊天机器人的基础上，RealChar 引入了语音和文字互转的技术，实现了通过语音和 AI 机器人实时聊天。RealChar 在使用上非常的简单，无需编码就能创建自己的 AI 角色，而且还支持自定义聊天的对象模型，比如，可以选择马斯克，乔布斯，蝙蝠侠，洛基等，轻松实现和名人的面对面聊天

【大模型】开源且可商用的大模型通义千问-7B（Qwen-7B）来了

Qwen-7B 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 基于 Transformer 架构，使用超大规模的预训练数据进行训练，包括网络文本、专业书籍和代码等多种类型。此外，Qwen-7B还使用了对齐机制打造了基于大语言模型的 AI 助手 Qwen-7B-Chat。

Qwen-7B 系列模型的特点包括：

🚀大规模高质量预训练数据：我们使用了超过 2.2 万亿 token 的自建大规模预训练数据集进行语言模型的预训练，涵盖了广泛的数据类型，包括文本和代码等，可满足不同领域的使用需求。

🚀优秀模型性能：Qwen-7B 在多个评测数据集上具有显著优势，甚至超过 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等，可满足用户多种需求。

🚀支持多语言：基于更大词表的分词器在分词上更高效，同时它对其他语言表现更加友好。用户可以在 Qwen-7B 的基础上更方便地训练特定语言的 7B 语言模型，可满足不同国家和地区的使用需求。

🚀8K 上下文长度：Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文长度，用户可以输入更长的 prompt，满足更复杂的问题处理需求。

🚀支持插件调用：Qwen-7B-Chat 针对插件调用相关的对齐数据做了特定优化，当前模型能有效调用插件以及升级为 Agent，可满足更多业务场景的应用需求。

评测表现

Qwen-7B 在多个全面的评测数据集上展现出优异的性能，包括 MMLU、C-Eval、GSM8K、HumanEval、WMT22 等，其能力超过了同规模的大语言模型，甚至超过了 12-13B 参数等更大规模的语言模型。

【大模型】开源且可商用的大模型通义千问-7B（Qwen-7B）来了