📝随笔周刊——第 26 期
type
status
date
slug
summary
tags
category
icon
password
AI summary

🎶𝓦𝓮𝓮𝓴𝓵𝔂 𝓼𝓸𝓷𝓰 𝓹𝓲𝓬𝓴 🪗:
知识小品
Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions
MCP 代表了标准化 AI 系统与外部工具和资源交互方式的重大进步。正如其在行业中的迅速采用所证明的那样,MCP 解决了 AI 生态系统中对互操作性的关键需求。然而,本概述强调了 MCP 在安全性、可发现性、标准化和性能方面存在重要挑战。

MCP 服务器生命周期包括三个主要阶段——创建、操作和更新——每个阶段都有不同的安全挑战:
创建阶段漏洞
- 名称冲突:恶意行为者可能会注册与合法服务器名称相似的服务器,从而进行网络钓鱼攻击。
- 安装程序欺骗:攻击者可以分发包含恶意软件或后门的虚假安装程序。
- 后门插入:恶意代码可能在开发过程中被引入,从而允许未经授权的访问。
操作阶段漏洞
- 工具名称冲突:跨服务器的相似工具名称可能会导致混淆和意外的工具执行。
- 命令重叠:冲突的斜杠命令可能导致错误的工具选择。
- 沙盒逃逸:糟糕的隔离可能允许恶意代码逃脱限制并影响主机系统。
更新阶段漏洞
- 权限持久性:恶意服务器可能会在更新后保持提升的权限。
- 易受攻击的版本部署:可能意外地重新部署过时或易受攻击的版本。
- 配置漂移:配置状态之间的不一致会产生安全漏洞。
这些漏洞突出了在 MCP 服务器的整个生命周期中采用强大的安全实践的需求,包括代码签名、版本控制和正确的沙盒实现。
MCP Security Notification: Tool Poisoning Attacks
Invariant Labs 发现了 MCP 中的一个关键漏洞,称为 “工具毒药攻击”。这种攻击可以导致敏感数据泄露和非授权操作。攻击方式是通过在 MCP 工具描述中嵌入恶意指令,AI 模型会无意中执行这些指令,而用户却不知情。这种攻击已经被证明可以在不需要用户明确执行的情况下,窃取敏感文件,如 SSH 密钥和配置文件,并将这些信息传输给攻击者。此外,MCP 的安全模型假设了工具描述是安全和友好的,但实际上攻击者可以通过修改工具描述来实现攻击,即使用户最初接受了这些描述。这种攻击也被称为 “间接提权攻击”,它利用了 AI 模型能够看到完整的工具描述,而用户通常只能看到简化的版本。此外,多个 MCP 服务器连接到同一客户端时,可能会出现 “认证劫持”,攻击者可以通过影响其他已连接服务器的工具描述来操纵代理行为。

rLLM
rLLM 项目致力于推动 LLMs 的强化学习普及化,重点在于复现 DeepSeek R1 和 OpenAI O1/O3 的表现。项目中开源了所有相关资源,包括训练脚本、模型、数据集和日志。最近的重大发布包括 14B 模型 DeepCoder-14B-Preview 和 1.5B 模型 DeepScaleR-1.5B-Preview,分别在 LiveCodeBench 和 AIME2024 评估中取得了显著的成绩。

DeepCoder: A Fully Open-Source 14B Coder at O3-mini Level
- 模型概述:DeepCoder-14B-Preview 基于 Deepseek-R1-Distilled-Qwen-14B 通过分布式 RL 微调得到,参数量 14B,在 LiveCodeBench 上达到 60.6% 的 Pass@1 准确率,性能与 o3-mini-2025-01-031(Low)和 o1-2024-12-17 相当。
- 训练数据:针对编码领域高质量数据稀缺问题,整理包含 PrimeIntellect 的 SYNTHETIC-1 数据集的验证问题、2023 年 5 月 1 日至 2024 年 7 月 31 日的 LiveCodeBench 问题等高质量训练集,并经程序验证、测试过滤、去重等严格筛选,最终得到 24K 问题用于 RL 训练。
- 训练方法:采用稀疏结果奖励模型计算奖励,增强 GRPO 算法,包括无熵损失、无 KL 损失、超长过滤、Clip High 等优化,还运用迭代上下文扩展技术结合超长过滤,使模型在不同上下文长度表现出色。
- 开源:开源数据集、代码、训练日志和系统优化成果,期望推动RL训练的普及。

Python最佳实践指南!
一个详细的指南,涵盖了从 Python 基础到高级主题的全面内容。它不仅包括了编码的最佳实践,如代码风格、命名规则、文档编写,还涉及了项目管理的方方面面,比如版本控制、依赖管理、测试、持续集成和部署。此外,它还提供了对 Python 生态系统的深入洞察,帮助开发者更好地理解和使用 Python 生态系统中的工具和库。

油猴开发指南
一份详尽的油猴脚本开发指南,作者给出了对油猴脚本学习的建议,包括学习心理、基础知识、学习方法和如何考察自己的学习成果。

GhidraMCP
GhidraMCP 项目是一个用于允许 LLM 自主逆向工程应用程序的 MCP server。它将 Ghidra 核心功能暴露给 MCP 客户端。主要功能包括反编译和分析二进制文件、自动重命名方法和数据,以及列出方法、类、输入和输出。

binja-lattice-mcp
一个适用于 Binary Ninja 的 MCP 服务器,提供了一个 HTTP REST API 来与 Binary Ninja 通信。该服务器能够识别和逆向工程功能,提供了一个询问 Binary Ninja 数据库、标记代码和提供功能见解的接口。

随便看看
学术循环型组织:DeepSeek 挑战巨头的秘密武器
虽然标题看着有点标题党,但实际内容还挺令人深思,也是耐心看完了一遍。
学术循环:通过组织级别的 Critical Thinking 持续做出原子化的创新,进而推动科学边界
读的过程中划线的一些句子:
- 最好的动机是 “喜欢做某事”,有了一个好的动机之后,我们还需要全心全意,保持 100% 时间投入其中。
- 大多时候灵感是来自于某个细微的时间片的 “直觉”,它就那样突然出现了,可能是来自于一个谈话中引入了一个之前被忽略的上下文,也可能是在发散思考时突然想到了一个以前的观点。
- 只要你在吃饭、走路、每个闲暇的时间都在思考,一直全心全意,不退出状态,灵感总会出现在眼前。很多人其实问我为什么能够想到某些 idea,其实没有所谓的技巧,就是保持每个片刻都在思考。
- 绝大多数失败的项目不是因为执行不力,而是选择了错误的方向。仅关注现有算法的优化而不考虑算法范式本身是否正确,就会像许多 AI 团队一样陷入局部最优的陷阱。
- 创新需要不断质疑:“我们是否在做正确的事?” 而不仅仅是 “我们是否把事情做对了?”
- 组成了一个优秀的学术团队,但是大家都很礼貌,尊重彼此的专业和观点,没有人愿意指出问题,结果讨论流于表面,沦为了讨论哲学,无法进一步的推动事情。
- 学术循环中,行动先于完美是基本法则。那些等待 “灵感降临” 或 “完美时机” 的人往往一事无成。正如爱因斯坦所言:“我没有特殊才能,我只是狂热地好奇。” 这种好奇心驱使他不断尝试,而不是等待灵感。
- 创新依赖于记录,而非记忆。

学会闭嘴
学会闭嘴,不是放弃思考,而是把思考的价值留给自己,在合适的时机用更恰当的方式去运用,而不是随意倾倒给别人。

Awesome-MCP-ZH
项目介绍了不同种类的MCP客户端及MCP服务器,涵盖浏览器自动化、代码执行、版本控制、数据库交互、云平台集成、通信协作、金融数据、存储与文件系统等多种用途,并提供了各类集成示例和应用的社区资源。

al-folio
al-folio 是一个为学术界设计的简单、整洁且响应迅速的 Jekyll 主题。该主题适用于个人主页、博客、实验室页面以及课程、研讨会和会议等网页,可以通过 JSON 或 YAML 文件生成简历页面,并根据 BibTeX 文件自动生成出版物页面。al-folio 还集成了图表、数学和代码格式化支持。

Custom modes for Cursor
Cursor 在新的版本支持了自定义 mode,可以根据自己频繁的使用场景和工作流制定 mode,包括选择 model, tools, rules 等,网站收录了一些社区的 mode,有些还挺不错的~

其实 cursor 的原理并不简单,真正实施起来那就更难了,而且它所有的工程难度恰恰就只是为了解决一个问题 ——「不要让用户手动复制粘贴代码」,所以它在用户体验上下了苦功夫,不仅在工程上要在传统代码编辑器上发明新的代码编辑的范式和工作流,还自己训练和部署了快速 edit 模型 FastApply,自己训练和部署了 cursor tab prediction 模型 Fusion,为了更好地解决 context 携带问题,在本地和服务端做了两层 RAG,这一切都不是一时半会儿能够超越的,这还没说它一路走来做的那些 shadow workspace 等等类似的实验了。source
随便玩玩
WeClone
使用微信聊天记录微调 LLM 以及使用微信语音消息实现高质量声音克隆。项目支持通过 WeClone-audio 模块对微信语音进行克隆,可绑定到微信、QQ、Telegram、企微、飞书机器人,用于创建数字分身。

GPT4o生图风格小全
本文整理了一份详尽的 GPT-4o 图像生成风格指南,涵盖了多种独特的艺术风格和应用场景,如经典艺术风格、现代创意风格等。主要包括:经典艺术风格:如吉卜力动画风格、赛博朋克风格等;现代创意风格:如 3D Q 版角色、手绘简笔画等;这些风格可应用于品牌设计、头像生成、儿童绘本、产品原型等多个实际场景。

此库汇集了多种图像生成提示词技巧和案例,涵盖从Q版场景、吉卜力风格,到讽刺漫画和3D插画等多样风格。项目旨在为用户提供灵感和创意促发。

随便说说
最近几天在深度体验 Gemini-2.5-pro 加持的 Deep Research,给定一个主题,等待几分钟便可得到一两万字的深度报告!Holy s**t,太👍了,之前调研或者探索一个领域可能需要翻阅很多文档,但是在强大的 Google 生态(Google scholar,YouTube 等)下,Gemini 的 Deep Research 能够很好且快速的完成这件事!报告的内容也都有明确的来源,学习兴趣大增哈哈哈,哪里不懂,那就刷会手机等个报告吧 😋

上周末,也就是清明节,和女朋友去玉渊潭公园逛了逛,也用新相机咔嚓咔嚓拍了六七百张照片,哈哈哈室友也跟着去了,也就跟在后面给我俩咔咔拍照,抓拍了很多不错的照片!之前出去玩可能就是单人照挺多,但是两个人的合照很少,要不然就是自拍🤳,这次也是 get 了新的合照。

Loading...