波波算法笔记

Bob Peng

最新文章

不懂业务的程序员不是好程序员

不懂业务的程序员不是好程序员

不懂业务的程序员,不是好程序员? 最近一周一直有在面试,相继也面了几个ai大厂,包括字节跳动、腾讯、质谱华章等。面试过程中, 我察觉到了这几个考察点: “ 第一是技术,其次是业务,然后是职场的沟通、合作。 今天想和大家聊一下业务,为什么程序员也需要关注这一点?我们是否有必要去提高业务能力。 为什么要
19
0
0
2025-04-01
被大厂HR技术官指点简历后我悟了

被大厂HR技术官指点简历后我悟了

最近笔者波波准备换新工作了。面试是不可或缺的一环,在此之前我更新了我的简历。 简历指2导来源于 国家级资深HR南希姐 、 网易技术官 、 阿里AI算法 、 AI产品经理 ,以及我的 直属领导、同事 。谢谢你们。 简历更新后也是很满意,因此想从不同角度谈谈自己的理解。 推荐一位资深的HR--南希姐,相
4
0
0
2025-04-01
WiseftRobustfinetuningofzeroshotmodels能解

WiseftRobustfinetuningofzeroshotmodels能解

Wise-ft《Robust fine-tuning of zero-shot models》,能解决大模型持续学习灾难性遗忘吗 微调框架: https://github.com/mlfoundations/wise-ft 论文链接 https://arxiv.org/pdf/2109.01903
10
0
0
2025-04-01
Tokenizer之BPE算法的简单实现

Tokenizer之BPE算法的简单实现

Tokenizer之BPE算法的简单实现 此篇幅较长,基本都是BPE分词代码,可以先了解一下理论篇: 大语言模型Tokenizer原理以及算法讲解(一) 🤗大致流程: • 规范化 • 预标记化 • 将单词拆分为单个字符
6
0
0
2025-04-01
VERA一种比Lora更省资源的微调方案

VERA一种比Lora更省资源的微调方案

VERA : 一种比Lora更省资源的微调方案 ❝ 《 VERA VECTOR-BASED RANDOM MATRIX ADAPTATION 》 直达链接: ❝ https://arxiv.org/pdf/2310.11454 引言 该论文基于Lora,提出了基于向量的随机矩阵自适应( VeRA )
4
0
0
2025-04-01
Transformer面试问

Transformer面试问

Transformer面试问 问题 Transformer为何使用多头注意力机制? Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘? Transformer计算attention的时候为何选择点乘而不是加法?两者计算复杂度和效果上有什么区别? 为什么在进
3
0
0
2025-04-01
VBlora分而共享比Lora更省资源性能不降

VBlora分而共享比Lora更省资源性能不降

VBlora “分而共享”,比Lora更省资源,性能不降。 VB-lora 源码 :https://github.com/leo-yangli/VB-LoRA 论文 :https://arxiv.org/abs/2405.15179 背景 随着大型语言模型的采用增加以及对每个用户或每个任务模型定制的
5
0
0
2025-04-01
Transformer的一点回顾学习

Transformer的一点回顾学习

Transformer的一点回顾学习 这几天打算整理一下学过的知识。手写笔记整理+代码理解 ,记录自己的学习 transformer 包括 笔记 和 代码 详细的代码 如果有不明白的地方,可以看代码加深理解!!! https://github.com/phbst/notes/blob/main/tr
3
0
0
2025-04-01
TIESMERGING多任务高效合并

TIESMERGING多任务高效合并

TIES-MERGING多任务高效合并 ❝ 大家好,我是 Bob! 😊 一个想和大家慢慢变富的 AI 程序员💸 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我,一起探索,一起破圈!💪 迁移学习——即在下游任务上进一步微调预先训练的模型——可以带来显着的优势,包括改进的下游性能、更快的收
4
0
0
2025-04-01
RAGRetrievalAugmentedGeneration检索增强生成进阶优化思路

RAGRetrievalAugmentedGeneration检索增强生成进阶优化思路

RAGRetrievalAugmentedGeneration检索增强生成进阶优化思路 承接上次RAG学习项目的分享,如果你没有看过上一篇,这里是跳转链接 用RAG技术让大模型开卷考试,建立私人数据库 上次的分享仅仅限于学习RAG的基本思路,只能说是一个最小的框架,其中有许多的问题需要解决优化,下面
5
0
0
2025-04-01