lora 微调3B模型微调前有5G 量化f16 后最后导出模型容量变小了只有2G了,为什么?

news/2024/9/22 6:54:42 标签: 人工智能, 大模型, 微调

环境:

lora 微调

问题描述:

lora 微调3B模型微调前有5G 量化f16 后最后导出模型容量变小了只有2G了,为什么?

解决方案:

在使用LoRA(Low-Rank Adaptation)对大语言模型(例如一个3B参数的模型)进行微调时,模型最终导出的容量变小可能是由于以下几个原因:

1. 量化

你提到量化为FP16(16位浮点数)。量化过程可以显著减少模型的存储需求。原始模型可能是以FP32(32位浮点数)存储的,而将其量化为FP16会直接将存储需求减半。具体的计算如下:

  • FP32: 每个参数占用4字节。
  • FP16: 每个参数占用2字节。

通过这种转换,模型的大小可以从5G减少到约2.5G(理论上)。这已经解释了一部分的容量减小。

2. LoRA微调

LoRA微调方法通过将原始权重分解成低秩矩阵来实现模型参数的高效更新,而不是直接对整个模型进行更新。LoRA微调主要更新的是分解矩阵,而这些矩阵通常要比原始模型的参数少得多。因此,导出的微调模型容量可能会进一步减少,因为只需存储这些低秩矩阵以及部分更新的参数,而不是整个模型的所有参数。

3. 剪枝和优化

微调和量化过程中,可能还会进行一些剪枝(Pruning)和进一步的优化来减少模型的大小。剪枝可以去除对模型性能影响不大的权重,从而减小模型容量。

4. 存储格式优化

在导出模型时,可能采用了更高效的存储格式。例如使用更紧凑的存储结构、压缩算法等。现代深度学习框架(如TensorFlow、PyTorch)有时会自动采用某些压缩技巧来优化存储。

总结

通过量化、LoRA微调、剪枝和存储格式优化等方法的组合,最终导出的模型容量通常会比原始模型显著减少。从5G减少到2G是这些多重因素共同作用的结果。

如果你有特定的工具或框架,可以查看其文档了解详细的模型优化和存储机制。这将有助于你更准确地理解模型大小变化的原因。如果有更多具体问题或需要进一步详细解释,请随时告知!


http://www.niftyadmin.cn/n/5669894.html

相关文章

视频V4改进

问1: 你好 下面是我的一个代码,我想通过代码实现对视频的每个不同的字幕帧截一个图保存下来 import cv2 import os from skimage.metrics import structural_similarity as ssim import numpy as np from PIL import Image # 视频路径 video_path /ka…

IDEA中Quarkus框架(3.13版本)开发、调试、部署、打包等

code-with-quarkus code-with-quarkus 是使用官网生成的demo项目 这个项目使用Quarkus(使用3.13.0版本,该版本支持JDK21),超音速亚原子Java框架。官网地址: https://quarkus.io/. 环境要求 OS: Windows 10.0 jdk 11 maven 3.9…

小米 13 Ultra机型工程固件 资源预览与刷写说明 步骤解析

小米 13 Ultra机型---机型代码为ishtar 。工程固件可以辅助修复格机或者全檫除分区后的基带修复。可以用于修复TEE损坏。以及一些分区的底层修复。此款固件也可以为更换UFS后的底包。 通过博文了解 1💝💝💝-----此机型工程固件的资源刷写注意事项 2💝💝💝-----此…

weblogic CVE-2018-2894 靶场攻略

漏洞描述 Weblogic Web Service Test Page中⼀处任意⽂件上传漏洞,Web Service Test Page 在 "⽣产模式"下默认不开启,所以该漏洞有⼀定限制。 漏洞版本 weblogic 10.3.6.0 weblogic 12.1.3.0 weblogic 12.2.1.2 28 weblogic 12.2.1.3 …

关系数据库和非关系数据库

关系数据库和非关系数据库(NoSQL数据库)在多个方面存在显著差异,这些差异主要体现在适用性、数据一致性要求、扩展性、数据模型、数据查询语言以及使用场景等方面。 1. 适用性 关系数据库:适合处理结构化数据。结构化数据是指具…

Python基于Django、大数据的北极星招聘数据可视化系统

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

分布式Id生成策略-美团Leaf

之前在做物流相关的项目时候,需要在分布式系统生成运单的id。 1.需求: 1.全局唯一性:不能出现重复的ID。(基本要求) 2.递增:大多数关系型数据库(如 MySQL)使用 B 树作为索引结构。…

[SDX35+WCN6856]SDX35 + WCN6856 默认增加打包wifi配置hostapd_24g.conf和hostapd_5g.conf操作方法

SDX35 SDX35介绍 SDX35设备是一种多模调制解调器芯片,支持 4G/5G sub-6 技术。它是一个4nm芯片专为实现卓越的性能和能效而设计。它包括一个 1.9 GHz Cortex-A7 应用处理器。 SDX35主要特性 ■ 3GPP Rel. 17 with 5G Reduced Capability (RedCap) support. Backward compati…