波波算法笔记

程序猿的恐慌时刻智能代码编辑器Cursor

智能代码编辑器Cursor 最近一款AI代码辅助编译器爆火--Cursor。链接直达：https://www.cursor.com/ 甚至有人扬言要取消copilot的订阅了。因为最新的版本实在是太强了！

AI笔记

7

0

2025-04-01

不懂业务的程序员不是好程序员

不懂业务的程序员，不是好程序员？最近一周一直有在面试，相继也面了几个ai大厂，包括字节跳动、腾讯、质谱华章等。面试过程中，我察觉到了这几个考察点: “ 第一是技术，其次是业务，然后是职场的沟通、合作。今天想和大家聊一下业务，为什么程序员也需要关注这一点？我们是否有必要去提高业务能力。为什么要

思考ing

27

0

2025-04-01

被大厂HR技术官指点简历后我悟了

最近笔者波波准备换新工作了。面试是不可或缺的一环，在此之前我更新了我的简历。简历指2导来源于国家级资深HR南希姐、网易技术官、阿里AI算法、 AI产品经理，以及我的直属领导、同事。谢谢你们。简历更新后也是很满意，因此想从不同角度谈谈自己的理解。推荐一位资深的HR--南希姐，相

思考ing

5

0

2025-04-01

WiseftRobustfinetuningofzeroshotmodels能解

Wise-ft《Robust fine-tuning of zero-shot models》，能解决大模型持续学习灾难性遗忘吗微调框架： https://github.com/mlfoundations/wise-ft 论文链接 https://arxiv.org/pdf/2109.01903

AI笔记

10

0

2025-04-01

Tokenizer之BPE算法的简单实现

Tokenizer之BPE算法的简单实现此篇幅较长，基本都是BPE分词代码，可以先了解一下理论篇：大语言模型Tokenizer原理以及算法讲解（一） 🤗大致流程： • 规范化 • 预标记化 • 将单词拆分为单个字符

AI笔记

7

0

2025-04-01

VERA一种比Lora更省资源的微调方案

VERA : 一种比Lora更省资源的微调方案 ❝ 《 VERA VECTOR-BASED RANDOM MATRIX ADAPTATION 》直达链接： ❝ https://arxiv.org/pdf/2310.11454 引言该论文基于Lora，提出了基于向量的随机矩阵自适应（ VeRA ）

AI笔记

4

0

2025-04-01

Transformer面试问

Transformer面试问问题 Transformer为何使用多头注意力机制？ Transformer为什么Q和K使用不同的权重矩阵生成，为何不能使用同一个值进行自身的点乘？ Transformer计算attention的时候为何选择点乘而不是加法？两者计算复杂度和效果上有什么区别？为什么在进

AI笔记

3

0

2025-04-01

VBlora分而共享比Lora更省资源性能不降

VBlora “分而共享”,比Lora更省资源，性能不降。 VB-lora 源码：https://github.com/leo-yangli/VB-LoRA 论文：https://arxiv.org/abs/2405.15179 背景随着大型语言模型的采用增加以及对每个用户或每个任务模型定制的

AI笔记

5

0

2025-04-01

Transformer的一点回顾学习

Transformer的一点回顾学习这几天打算整理一下学过的知识。手写笔记整理+代码理解，记录自己的学习 transformer 包括笔记和代码详细的代码如果有不明白的地方，可以看代码加深理解！！！ https://github.com/phbst/notes/blob/main/tr

AI笔记

3

0

2025-04-01

TIESMERGING多任务高效合并

TIES-MERGING多任务高效合并 ❝ 大家好，我是 Bob! 😊 一个想和大家慢慢变富的 AI 程序员💸 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我，一起探索，一起破圈！💪 迁移学习——即在下游任务上进一步微调预先训练的模型——可以带来显着的优势，包括改进的下游性能、更快的收

AI笔记

8

0

2025-04-01

Bob Peng

Bob Peng

最新文章

程序猿的恐慌时刻智能代码编辑器Cursor

不懂业务的程序员不是好程序员

被大厂HR技术官指点简历后我悟了

WiseftRobustfinetuningofzeroshotmodels能解

Tokenizer之BPE算法的简单实现

VERA一种比Lora更省资源的微调方案

Transformer面试问

VBlora分而共享比Lora更省资源性能不降

Transformer的一点回顾学习

TIESMERGING多任务高效合并