LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家
名称: /pengxiao-song/LaWGPT

地址: https://github.com/pengxiao-song/LaWGPT

fork: 71  star: 870  开发语言: Python

 

项目简介: Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型

LaWGPT 是一款基于中文法律知识的开源大语言模型,可以回答法律相关的的问题和书写法律相关的文书,比如回答加班工资怎么计算, 帮助书写案情描述等。因此我们可以用它充当私人律师,向它咨询一些法律问题。

如果 AI 充分发展,是否可以帮人辩护,进而冲击律师这个职业呢?

LaWGPT模型是在通用中文基座模型如 Chinese-LLaMA、ChatGLM 等的基础上,添加了法律领域专有词表,使用了大规模中文法律语料进行了预训练,增强了大模型在法律领域的基础语义理解能力。

项目组在上面的基础上,同时构造了法律领域对话问答数据集、中国司法考试数据集,并进行指令精调,提升了模型对法律内容的理解和执行能力。
LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家
在使用LaWGPT 时,只需要在左侧的输入框中,输入想要咨询的问题,其他根据需要进行设置,然后点击”submit“,就可以在右侧看到回答了。接下来看几个实例:
假设已知某案情的具体描述,想要书写一份判决意见,那我们只需要输入案情描述,并给出具体的要求 “写一份判决意见”,就可以让 LawGPT 输出判决意见:
LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家
五一劳动节刚过,我们又正好在五一期间存在加班,那么加班费如何计算呢?我们可以输入”加班工资怎么算” 进行咨询

LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家

大部分人的都在使用信用卡,如果信用卡预期还不上,会坐牢吗,也可以问问 LawGPT 

LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家

如果想要书写一份抢劫案的案情描述,直接输入”抢劫罪罪名的案情描述
LaWGPT:基于中文法律知识的大语言模型,未来的私人法律专家
LawGPT 项目工程目录非常的简洁,具有很好的参考性
LaWGPT├── assets # 项目静态资源├── data   # 语料及精调数据├── tools  # 数据清洗等工具├── README.md├── requirements.txt└── src    # 源码    ├── finetune.py    ├── generate.py    ├── models  # 基座模型及 Lora 权重    │   ├── base_models    │   └── lora_weights    ├── outputs    ├── scripts # 脚本文件    │   ├── finetune.sh # 指令微调    │   └── generate.sh # 服务创建    ├── templates    └── utils
LawGPT 从源码到最终可以提供法律咨询服务,经过了 数据构建,模型训练,二次训练,指令精调 四个阶段。整个过程使用了 8  张 Tesla V100-SXM2-32GB ,二次训练阶段耗时约 24h / epoch,微调阶段耗时约 12h / epoch

LawGPT 目前已经具备了初步回答法律问题的能力,但是受限于有限的数据量,模型容量等因素,在理解用户意图上仍然存在欠缺,可能会输出不正确的内容,因此现在也就只能当做一个 demo 来研究了。

更多内容,请到 Github 观看: https://github.com/pengxiao-song/LaWGPT
© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...