📝随笔周刊——第 28 期

type
status
date
slug
summary
tags
category
icon
password
AI summary
在荟聚商场连接新光界的桥上,看到了好美的色调
在荟聚商场连接新光界的桥上,看到了好美的色调

知识小品

Hugging Face MCP 教程

hugging face 出品,必属精品 😋
📖 学习模型上下文协议的理论、设计和实践。
🧑‍💻 学会使用已建立的MCP SDK和框架。
💾 分享您的项目并探索由社区创建的应用程序。
🏆 参加挑战,评估您的MCP实现与其他学生的对比表现。
🎓 通过完成任务获得结业证书。
notion image

How to handle rate limits

在请求 LLM API 处理批量数据时,如果并发值设置的很高,很容易遇到 Rate Limit Error,如果没有进行合适的错误处理,可能导致程序退出、结果未保存等。所以最好有一套成熟的方案能够解决并行处理时的速率限制问题,包括重试机制、速率控制机制、错误日志记录以及结果保存等。
翻了翻 OpenAI 的 Cookbook,还真有教程:
  1. 并发: 通过 asyncioaiohttp 将每个 API 调用封装成一个独立的异步任务,使多个请求可以并发进行
  • 速率控制: 在发起新请求之前,检查当前剩余的请求和令牌容量,只有容量足够才允许发起请求。容量会随着时间恢复。
  • 重试: 失败的请求会被放回一个队列,并在主循环中优先被取出并重试。
  • 错误处理: 解析响应、检查错误,并将失败的请求重新加入重试队列或记录为最终失败。
  • 状态跟踪: 记录整个处理过程中的关键统计数据。
  • 冷却: 在检测到速率限制错误后,脚本会强制暂停一段时间,以避免连续触发错误。
💡
之前一直没怎么尝试过使用异步机制来处理这种 I/O密集型任务,基本都用的是多线程来处理的。但学习之后,还是异步处理开销更小,其是单线程内的协作式多任务,通过事件循环和协程 (async/await) 实现并发(并不是并行)。对于多线程,由于 Python 本身的 GIL 存在,同一时刻也只有一个线程能执行Python字节码,而且线程的上下文切换开销还比较大~

Cybersecurity AI (CAI)

Cybersecurity AI (CAI) 是一个开源、轻量化且模块化的网络安全人工智能框架,专为 Bug Bounty 和网络安全任务设计。其核心功能包括通过代理模式、工具集成与跟踪日志实现漏洞扫描、网络安全任务执行及高效协作。框架支持多种语言模型(如 OpenAI、Anthropic 等)并结合了人机协作设计,适用于进攻与防守的网络安全应用场景。
(完成度看着挺高的 👀,还有篇对应的论文:https://arxiv.org/pdf/2504.06017
notion image

SeaGOAT

SeaGOAT 是一款面向 AI 时代的语义代码搜索引擎,它通过向量嵌入技术实现对代码库的本地语义搜索。
  • 支持的语言包括 Python、C/C++、TypeScript、JavaScript、HTML 等多种编程语言。
  • 使用 ripgrep 提供正则表达式和关键字搜索,结合 ChromaDB 实现向量数据库支持。
  • 全部功能本地执行,无需依赖第三方 API,保障数据隐私。
notion image

dify-plugin-SandboxFusion

基于字节开源的 SandboxFusion 创建的 dify 插件,用于在沙盒环境中运行和测试代码,支持超过 23 种编程语言。
notion image

AutoGenLib

好新奇的代码生成方式,通过 OpenAI 的 API 动态生成代码,允许用户在导入不存在的模块或函数时,根据描述即时生成。其功能包括动态代码生成、上下文感知、渐进增强、错误处理等。
notion image

随便看看

The heart of the Arctic

视频没有刻意渲染 “世界尽头” 的孤寂,反而在蓝调时刻的小镇烟火气中,在居民与自然共生的日常里,让我们看见:所谓极地的 “严酷”,早已被人类对故土的热爱酿成了温柔的诗篇。当无人机掠过心形山峰,当雪橇犬在冰原上奔跑,当暮色为彩色小屋镀上金边,镜头定格的不仅是自然的壮美,更是对 “生存” 与 “归属” 的深刻叩问 —— 在这个连阳光都需要计算时长的地方,人们用勇气与智慧书写着与自然最本真的联结,也让身处都市的我们,在冰川消融的叹息中,重新思考何为 “值得奔赴的远方”
notion image
真的被这张照片美哭了 😭😭😭,太有故事感了!

VRAM & Performance Calculator

一个很实用的网站,它可以根据用户选择的具体模型类型、所采用的微调或推理策略、各种 lora 相关参数设置、batch_size 数值等关键配置参数,以及用户的实际硬件设备配置情况,来精确计算在模型推理或微调过程中所需要的显存大小。更加实用的是,它还能够直观地展示出模型在运行过程中不同组件和功能模块的具体显存占用分布比例,让用户能够清晰地了解显存使用的详细情况。这对于优化模型训练和部署非常有帮助!
notion image

Vscode 浅色主题

最近看到个浅色主题 Nord Light 还挺好看的,用时间长了深色模式,用了这个主题有点爱不释手~
notion image

在 Cursor 中如何选择模型

Curosr 官方发布了模型选择指南,可以当作一个参考,大概就是:
  1. 如果想让 AI 来进行规划、思考如何解决问题,gemini-2.5-pro 和 claude-3.7-sonnet 比较适合
  1. 如果想让 AI 执行明确清晰的指令,那 claude-3.5-sonnet 和 gpt-4.1 更适合
  1. 更复杂的任务:使用 max mode 或者 o3
notion image

ChinaTextbook

从小学到大学的各科目的教学教材,还有不同的出版社,无敌!没上过的音乐课都有 🫡
notion image

随便玩玩

LinuxMirrors

LinuxMirrors 是一个开源项目,提供 GNU/Linux 系统换源脚本和 Docker 安装与换源脚本,支持多种主流 Linux 发行版(如 Debian、Ubuntu、CentOS、Arch Linux 等)以及相关版本,旨在简化镜像源更换过程并为用户提供便利。
notion image

MathModelAgent

MathModelAgent 是一个专为数学建模设计的智能代理项目,其主要功能是自动完成数学建模、编写代码、撰写论文,并生成一份可以直接提交的完整论文。项目的愿景是通过快速自动化减少赛事所需时间(从3天缩短至1小时),目标生成获奖级别的建模论文。
(我上大学咋就没有这好玩意呢 hhh,也不至于报了两次数模都在宿舍组团打游戏了 🫠
notion image

YAMLResume

yamlresume 是一个基于 YAML 的简历管理和生成工具,可以通过 YAML 文本高效地管理和版本控制简历,并快速生成排版精美的 PDF 简历。
  • 内容与展示分离,类似 HTML 和 CSS。
  • 使用结构化的 YAML 管理简历内容,具有良好的可读性。
  • 通过可插拔的排版引擎将 YAML 转换为 PDF,可调整字体、页边距等布局。
notion image

随便说说

五一回了趟家,见了我姐的男朋友😃,也是提前体验了一次双方家长见面吃饭的场景。
研一快结束了😮‍💨,自己也没想出来啥 idea,没开始自己的工作,目前都是和师兄一起或者帮师兄跑实验啥的(´・_・`),🧠咋就没啥好想法呢🥵
抢到了凤凰传奇的 380 票,✌️,天台蹦野迪💃
Loading...

© huhu 2023-2025