type
status
date
slug
summary
tags
category
icon
password
AI summary
这周没拍什么,用一张当时丽江拍的玉龙雪山照片
这周没拍什么,用一张当时丽江拍的玉龙雪山照片

🎶𝓦𝓮𝓮𝓴𝓵𝔂 𝓼𝓸𝓷𝓰 𝓹𝓲𝓬𝓴 🪗:

知识小品

How to fine-tune open LLMs in 2025 with Hugging Face

本文详细介绍了如何在 2025 年使用 Hugging Face 平台对开源大型语言模型进行微调。文章首先指出,随着 2024 年的发展,LLMs 变得更加小型、高效,且能够通过提示处理多种任务。尽管如此,对于需要高精度或领域专业知识的特定应用,微调仍然是提高结果质量、降低成本、确保特定用例的可靠性和一致性的有力方法。
文章列出了微调 LLMs 的五个主要步骤:定义一个合适的微调用例、设置开发环境、创建和准备数据集、使用 trl库和 SFTTrainer 微调模型,以及测试和评估模型。解释了 QLoRASpectrum 如何通过 4 位量化和最小参数更新以及通过信噪比分析选择最有信息的层进行有效的微调。
notion image

TRL - Transformer Reinforcement Learning

TRL(Transformer Reinforcement Learning)是一个用于使用 SFT、PPO 和 DPO 等高级技术对基础模型进行后训练的综合库。它建立在 Transformers生态系统之上,支持各种模型架构和模态,并可以在各种硬件设置上进行扩展。
notion image

Finally, a Replacement for BERT

新型的 encoder-only 模型 ——ModernBERT,对 BERT 模型的改进,提供了更长的序列处理能力(8192)、更好的下游任务性能和更快的处理速度。ModernBERT 有两种尺寸:base(139M 参数)和 large(395M 参数),并且在transformers库的 v4.48.0 版本中得到了支持。ModernBERT 使用了最新的大型语言模型的技术进展,包括改进的架构和训练过程,如使用旋转位置嵌入(RoPE)、GeGLU 层、移除不必要的偏置项以及增加额外的归一化层。
notion image

算法新解——第二版本

作者从2009年开始编写,并于2017年发布了第一版中文版本。2020年至2023年,作者对项目进行了重写和改进,发布了第二版英文和中文版本,并进行了开源。
notion image

O1 Replication Journey

O1 技术开源复现之旅。该团队由上海交通大学 GAIR 研究组的本科生和博士生组成,并得到了来自纽约大学和 MBZUAI 的顶尖研究科学家的指导。
notion image

1 dataset 100 visualizations

通过一个简单的数据集,创造出 100 种 insightful 且视觉上吸引人的数据可视化。这个实验旨在展示数据可视化的广泛性和深度,以及如何利用有限的视觉属性和资源讲述不同的故事。网页上列出了 100 种不同的数据可视化方法,每一种都是对原始数据集的独特解释和展示。(可以扩展一下可视化图表的视野和角度)
notion image

随便看看

照明商店 조명가게

一群素昧平生的人,努力与过去和解。试图抚平过往伤痛的陌生人们,在因缘际会下,被吸引到一间在幽暗巷子尽头的照明商店。
最近看了这部剧,虽然剧情比较短,但故事情节挺完整的,人物塑造的也比较丰满。剧情整体都是昏暗的色调,因为故事主要地点发生在没有白天的死亡后的世界,所以前四集其实有点惊悚的,黑暗的巷子,突然坏掉的灯泡,路上古怪的人们等,但,后四集会发现,一切都是有原因的,每个古怪的人背后都关联着一位濒死之人的感人故事…
(后面太感人了😭😭😭)
notion image

homepage

一个好看的个人主页模板,有时间也搞一个~
notion image

Vscode Themes

网站提供了大量的 Vscode 主题,并且可以通过下载量等进行筛选,还能直接预览不同的配色。
notion image

随便玩玩

gitsu

gitsu 是一个简单的命令行工具,用于轻松切换 Git 用户。它提供了一些常见的功能,如添加、修改、删除和选择 Git 用户配置文件。适用于本地有多个 Git 账户的情况。
notion image

Awesome-Selfhosted

一个免费软件网络服务和Web应用程序的列表,可以托管在您自己的服务器上。小鸡闲置的可以看看有没有感兴趣的服务,开整!
notion image

随便说说

很不幸,我又感冒了,流鼻涕+咳嗽,幸好没发烧什么的。来北京四个月,三个月中都有生病😷,看来我真适应不了这种气候🥲
两周前就说写总结,现在还没动笔(。o‿o。)✎,不能再拖了😮‍💨
咔!𝟐𝟎𝟐4 结束啦~布尔逻辑表达式取反
Loading...
huhu
huhu
一个喜欢折腾的人👻
小红书
最新发布
随笔周刊——第 19 期
2025-1-15
随笔周刊——第 2 期
2025-1-15
随笔周刊——第 6 期
2025-1-15
Do Emergent Abilities Exist in Quantized Large Language Models
2025-1-15
Code Translation
2025-1-15
随笔周刊——第 7 期
2025-1-15
公告