【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了
点击上方 壹家大数据,关注后发现更多精彩内容

数据来源:https://github.com/trending,后台回复 230101,获取 github 爬虫

免费提供 github 热搜历史数据,后台回复 邮箱 即可

名称: /QwenLM/Qwen-7B

地址: https://github.com/QwenLM/Qwen-7B

fork: 89    star: 1,592    开发语言: Python


项目简介: The official repo of Qwen-7B (通义千问-7B) chat & pretrained large language model proposed by Alibaba Cloud.

在时间的冲蚀下,许多照片都失去了原本的色彩。然而在老照片修复的过程中,专业度要求很高的 PS 工具,对大部分人来说上手太难了。在文字聊天机器人的基础上,RealChar 引入了语音和文字互转的技术,实现了通过语音和 AI 机器人实时聊天。RealChar 在使用上非常的简单,无需编码就能创建自己的 AI 角色,而且还支持自定义聊天的对象模型,比如,可以选择马斯克,乔布斯,蝙蝠侠,洛基等,轻松实现和名人的面对面聊天

【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

Qwen-7B 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 基于 Transformer 架构,使用超大规模的预训练数据进行训练,包括网络文本、专业书籍和代码等多种类型。此外,Qwen-7B还使用了对齐机制打造了基于大语言模型的 AI 助手 Qwen-7B-Chat。

Qwen-7B 系列模型的特点包括:

🚀大规模高质量预训练数据我们使用了超过 2.2 万亿 token 的自建大规模预训练数据集进行语言模型的预训练,涵盖了广泛的数据类型,包括文本和代码等,可满足不同领域的使用需求。

🚀优秀模型性能Qwen-7B 在多个评测数据集上具有显著优势,甚至超过 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等,可满足用户多种需求。

🚀支持多语言基于更大词表的分词器在分词上更高效,同时它对其他语言表现更加友好。用户可以在 Qwen-7B 的基础上更方便地训练特定语言的 7B 语言模型,可满足不同国家和地区的使用需求。

🚀8K 上下文长度Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文长度,用户可以输入更长的 prompt,满足更复杂的问题处理需求。

🚀支持插件调用Qwen-7B-Chat 针对插件调用相关的对齐数据做了特定优化,当前模型能有效调用插件以及升级为 Agent,可满足更多业务场景的应用需求。

01
评测表现

Qwen-7B 在多个全面的评测数据集上展现出优异的性能,包括 MMLU、C-Eval、GSM8K、HumanEval、WMT22 等,其能力超过了同规模的大语言模型,甚至超过了 12-13B 参数等更大规模的语言模型。

【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

02
使用体验

目前在魔塔(ModelScope)上部署了聊天机器人🤖,登入后,就可以开始对话了。

访问地址:

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

假设小明要到杭州三日游,需要制作一份旅游攻略,那么就可以找 Qwen-7B-Chat 帮忙了。


【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

西湖傍边住宿太贵了,小明还只是一个学生,想要找一些便宜的地方

【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

小明突然又想起来大家经常说杭州市美食荒漠,正好可以问问 Qwen-7B-Chat

【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了

另外,Qwen-7B 允许进行二次开发,并且还可以进行商业使用。

详情可到 Github 观看:
https://github.com/QwenLM/Qwen-7B/

© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...