分类：AI笔记 - 波波算法笔记

聊聊我眼中的DeepSeekR1当AI学会quot读心术quot

聊聊我眼中的deepseek R1 这次的年前的deepseek的王炸R1模型，给我最大的震惊就是思维链（cot）的能力。它以“无需复杂指令，一键生成优质内容”的标签横空出世，智能模型越来越“懂人心”。从“服从指令”到“预测意图” 与传统的AI能力相比，他在反思用户指定的同时也会对指令的深度进行推

AI笔记

12

0

2025-04-01

每位程序员都应该立即体验Claude35Artifacts

每位程序员都应该立即体验 Claude 3.5 + Artifacts！就在不久前， Anthropic公司推出了一款名为Claude 3.5 Sonnet的全新大型AI模型，宣称其智能程度达到了前所未有的高度，并且将向全球用户提供免费试用的机会。 **Anthropic 还给 Claude 3.

AI笔记

2

0

2025-03-31

模型调参大法让你的模型更进一步

模型调参首先需要牢记一个点：模型选型和数据质量决定了任务的底线，而调参只是锦上添花（也可能雪上加霜）的工作所以优先考虑模型与数据，再考虑微调，能不调就不调。模型与数据任务首先要明确任务是分类、回归、生成、排序模型架构不同的模型架构在同意任务上的性能不一。选择合适的架构（gpt,be

AI笔记

6

0

2025-03-31

企业如何进一步拥抱AI搭建RAG本地私有知识库篇

企业如何进一步拥抱AI：搭建RAG本地私有知识库篇随着国运级AI：Deepseek的出现，很多企业从原有的观望想法，走到试一试的态度尝试，甚至很多已经想要直接用AI赋能企业。我觉得企业要拥抱AI，第一个必须要做的，就是私有化的公司内部知识库。什么是知识库，怎么用？给大家放一张图，看看知识库在

AI笔记

1

0

2025-03-31

什么你还不会微调T5模型手把手教你弄懂

什么？你还不会微调T5模型？手把手教你弄懂！什么是T5架构模型有详细了解的小伙伴可以看看论文：《Exploring the Limits of Transfer Learning with a UnifiedText-to-Text Transformer》 https://arxiv.org

AI笔记

22

0

2025-03-31

如何不使用PEFT手写Lora微调

如何不使用PEFT，手写Lora微调？ ❝ 前阵子的面试给了我很多启发,公司的业务为了效率都会套用框架,这是一件很简单的事情.但是会用不代表懂,你还真不一定理解内部运行原理. 我称其为调参侠哈哈.尽管很多时候,能用就行.但是算法工程师的基本素质还是需要具备的,这些内容在面试中经常涉及. 或许某一

AI笔记

21

0

2025-03-31

深度学习模型环境搭建Ubuntu

深度学习/模型环境搭建（Ubuntu）这几天笔者忙于工作入职，没怎么更新。接下来一段时间坚持日更哈，记录工作与学习！！！本次分享的主题：深度学习/大模型环境搭建（Ubuntu） NVIDIA驱动一般命令行执行 nvidia-smi 如果出现以下信息则表示存在显卡驱动/安装成功：我这边已

AI笔记

7

0

2025-03-31

腾讯全方面接入Deepseek背后到底有哪些布局

腾讯全方面接入Deepseek,背后到底有哪些布局？腾讯的大招不知道最近大家有没有观察到这样的现象：所有的互联网大厂都在不断地接入Deepseek ，把AI渗透到各个产品中。但腾讯面对这一波风口反应无非是最快的一个。举几个例子：微信内置AI搜索 APP：Ima 腾讯元宝腾讯云开发工具这

AI笔记

3

0

2025-03-31

微调不够对齐来凑强化学习让模型更进一步

微调不够，对齐来凑。强化学习--让模型更进一步链接 https://arxiv.org/pdf/2203.02155 提出动机 GPT-3虽牛，但仍会生成一些带偏见、不真实、有害的负面信息，有时候一本正经胡说八道。这从做研究的角度来看，确实没啥，因为你只要在某个数据集上碾压对手，那就是牛的。但对于

AI笔记

5

0

2025-03-31

新型AI大模型微调方式ReFT表征微调

新型AI大模型微调方式：ReFT 表征微调 ReFT (表征微调) 本文主要介绍 ReFT(表征微调)，这是一种比 PeFT(参数高效微调)效果更好的新的大语言模型微调技术。背景 PEFT PEFT (Parameter-Efficient Fine-Tuning，参数高效微调) 是一种仅微调少量

AI笔记

7

0

2025-03-31

Bob Peng

Bob Peng

AI笔记

聊聊我眼中的DeepSeekR1当AI学会quot读心术quot

每位程序员都应该立即体验Claude35Artifacts

模型调参大法让你的模型更进一步

企业如何进一步拥抱AI搭建RAG本地私有知识库篇

什么你还不会微调T5模型手把手教你弄懂

如何不使用PEFT手写Lora微调

深度学习模型环境搭建Ubuntu

腾讯全方面接入Deepseek背后到底有哪些布局

微调不够对齐来凑强化学习让模型更进一步

新型AI大模型微调方式ReFT表征微调