Bob Peng
Bob Peng
Hi there 👋 NLPer
首页
思考ing
AI笔记
瞬间
关于 Me
首页
思考ing
AI笔记
瞬间
关于 Me
最新文章
Meta发布llama31405B开源模型王座一夜易主基准测试力压GPT4o
Llama 3.1模型提前泄露,基准测试出人意料 就在昨天Meta即将发布的llama3.1系列模型被提前泄露,基准测试和磁力链已经传得满天飞了。 测试结果出人意料,尤其是405B与70B.评测结果力压同类竞品。 这里要注意几个点: llama 3.1 405B只是一个base模型。并没有进行过微调
AI笔记
0
0
0
2025-04-01
OpenAI最新发布的o3模型未来码农或将不复存在
OpenAI 最新发布的 o3 模型:未来码农或将不复存在? OpenAI 连续12天的直播终于落下帷幕。令人意外的是,最后一天的核心内容竟然是 o3 以及 o3 mini 的预告。 ❝ 注:OpenAI 为避免版权纠纷,直接跳过 o2 命名,采用 o3。 如果用一句话来描述 o3,那就是: **
AI笔记
0
0
0
2025-04-01
LLama3模型架构分析
LLama3模型架构分析 ❝ 首先回忆一下gpt架构。主流的大语言模型几乎都是由生成式GPT改进而来 [图片] LLama3 相较与GPT2的模型架构还是有改进的: 位置编码 :去除了绝对位置编码,采用了旋转位置编码 RoPE ,可以兼顾相对位置和绝对位置的信息以提高模型的泛化能力。 分组查询注意力
AI笔记
2
0
0
2025-04-01
大二大三学校不让出去实习怎么办
大二/大三学校不让出去实习怎么办? 最近有很多同学有问我这个问题,因为我算是我们那一批最早出去实习的一个人,今天说说我怎么打破规则的,从学校走到职场的 我怎么出去的 我当初去请假的时候,学院是严格不批准的,因为你是一个学生,你的基本任务就是要完成学业。但是由于计算机专业的特殊性,我之前也讲过了,我必
思考ing
2
0
0
2025-04-01
打怪升级之路找工作篇一
打怪升级之路—找工作篇(一) 最近一段时间,我一直有在投递简历,找工作。 如果你也是这样,你可能会存在着这样的问题:简历该怎么写?面试开始前应该做哪些工作?面试时该怎样去表现? 我在最起初也是一脸茫然。但经历了大量的面试,对于面试也是有点心得想分享给大家。 ** 简历 ** ** 简历结构 ** 一
思考ing
1
0
0
2025-04-01
大模型评估框架OpenCompass
最近一段时间都在做模型的微调与预训练。但是经过模型调参的模型并不一定能力提升,而且主观的几个问答并不能体现模型在模型方面的能力,我们需要更加直观的测试结果。 所以就有了模型评测,目前比较高效、便捷的框架就是OpenCompass。接下来围绕OpenCompass的实战聊聊。 OpenCompass安
AI笔记
0
0
0
2025-04-01
大模型训练框架LLaMAFactory覆盖预训练指令微调强化学习评估全流程
大模型训练框架LLaMA-Factory,覆盖预训练、指令微调、强化学习、评估全流程 ** ** ** 1. 项目背景 ** 开源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用数据进行训练而来,其对于不同下游的使用场景和垂直领域的效果有待进一步提升,衍生出了微调训练相关的需求,包含
AI笔记
2
0
0
2025-04-01
大模型学习资源汇总我也在学习你可不要落下
❝ 大家好,我是 Bob! 😊 一个想和大家慢慢变富的 AI 程序员💸 分享 AI 前沿技术、项目经验、面试技巧! 欢迎关注我,一起探索,一起破圈!💪 ❝ 最近笔者波波自己也有在好好学习喔,你也不能落下,所以把自己汇总的资源分享给大家参考。 论文系列 https://blog.csdn.net
AI笔记
1
0
0
2025-04-01
动手学深度学习v2学习篇预备知识一
《动手学深度学习》v2学习篇--预备知识(一) 前言 嘿!这里是笔者的《动手学深度学习》v2学习篇,最近一段时间由于工作需要,目前在深度学习“深度学习”,以下皆为学习笔记与思考的分享。欢迎指正与follow。 本次分享:数据基本操作 torch数据创建你会发现与numpy非常相似,张量(tensor
AI笔记
2
0
0
2025-04-01
大语言模型Tokenizer原理以及算法讲解一
大语言模型Tokenizer原理以及算法讲解(一) tokenizer的定义 tokenizer也叫分词器 作用: • 文本序列 通过 Tokenizer 被转化为 数字序列 (token 编号/id)。 • 是训练和微调大型语言模型(LLM)必不可少的一部分。
AI笔记
3
0
0
2025-04-01
上一页
下一页