回复 230101,获取 github 爬虫,回复 邮箱 获取 github 热搜历史数据
我深信有意义的不是微信,而是隐藏在对话框背后的一个个深刻故事。
未来,每个人都能拥有 AI 的陪伴,而我们的数据能够赋予 AI 有关于我们过去的珍贵记忆。我希望每个人都有将自己的生活痕迹留存的权利,而不是当成手机里的垃圾被清理掉。
AI 的发展不仅仅是技术的提升,更是情感的延续。每一个对话、每一个互动都是生活中独一无二的片段,是真实而动人的情感交流。
因此,如果这些聊天数据可以被妥善利用,我们就能创建数字分身,真正独特的、属于个体的人工智能。
也就能让 AI 成为生活中的朋友,能够理解、记录并分享我们的欢笑、泪水和成长。AI 也就不再是高不可攀的存在,而是融入我们生活中的一部分。
所以,我们需要 留痕。
留痕 是 GitHub 上的一个开源项目,可以使用我们和他人的微信聊天记录,训练出独属于我们个人的 AI。
项目功能
-
批量导出聊天数据:支持批量导出,可以自定义导出的时间,想要哪个勾选哪个
-
支持格式丰富:支持 html、PDF、word、excel 和 txt 的格式导出聊天记录
-
年底聊天报告:最常用表情包,年度热词,一键尽收眼底
-
AI 聊天助手:使用聊天记录培养的 AI,独属于你的 AI
-
支持导出朋友圈
-
支持导出群聊天记录
使用效果
留痕 还原了聊天界面,后面的操作也都是在这个界面中进行,所以操作非常简单。接下来,我们一起看看使用效果。
导出聊天数据
安装使用
有多种安装方式可供选择。
按照开发指南操作就可以了。不过需要配置环境,还要安装第三方库 MSVC,上手难度比较高,新手不推荐使用这种方式。
留痕 使用 ChatGLM3-6B 大模型,需要从下面的地址下载:
https://github.com/THUDM/ChatGLM3
然后按照大模型训练指南对模型进行微调,支持单机单卡,单机单卡和多级多卡。微调完成后,就可以得到属于我们自己的 AI 了。经过大量的数据训练后,应该可以模拟对方的聊天语气和聊天风格。
留痕 提供了在线服务网站,可以在线体验
留痕 出现,让我们看到个人的聊天记录将会变成宝贵的财富,每个人都会拥有自己的数字分身。也许多年以后,我们就不再需要墓地了,每个人搞一块硬盘就可以了,没事还可以和家人聊聊天。