Llama3的传奇还在继续，网友手搓Llama3-12B-Chinese，Ollama轻松部署-白红宇的个人博客

发布日期：2025-04-11 01:07:19 浏览次数：8 分类：精选文章

本文共 846 字，大约阅读时间需要 2 分钟。

Llama3-120B的神秘大模型之所以备受关注，背后隐藏着一个巧妙的技术：MergeKit模型合并工具的应用。原本宣称拥有120B参数的模型，实则是通过将Meta官方的Llama3 70B模型进行自定义合并（Self-Merge）而成。

MergeKit是一款专注于预训练模型合并的工具包，支持完全在CPU上运行，仅需8GB以上VRAM即可加速。该工具已在GitHub上获得3.6k星，现支持包括Llama、Mistral、GPT-NeoX、StableLM等多种模型。

基于同样的合并思路，开发者推出了Llama3-12B模型。该模型采用中文微调，整合了hfl/llama-3-chinese-8b-instruct-v2作为基础，通过直通合并方法实现了模型扩展。具体配置包括多次层范围的合并，整体保持模型的有效性同时提升性能。

此外，开发者还开源了GGUF模型框架，使得Ollama部署变得更加便捷。以下是使用Ollama部署Llama3-12B的具体步骤：

从Huggingface下载模型文件：[链接已移除]

创建名为Modelfile的配置文件，定义模型路径和参数

使用命令ollama create llama3:12b -f Modelfile在Ollama中创建模型

验证模型是否成功创建，执行ollama list查看模型列表

对于AI学习新人而言，掌握大模型AI的基础知识至关重要。虽然大模型能够提升生产效率，但个人学习路径仍需突破：

学习大模型AI是一个持续的过程，建议从基础知识入手，逐步深入实践。通过系统的学习和实践，相信每位开发者都能在AI领域找到属于自己的突破点。

下一篇：Llama 越狱探索 Llama-3.1-8B-Instruct去除限制过程

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！