每日记录

博客优化

2026-03-12

博客优化

已提交

Picgo + 腾讯云 COS 图床配置

之前图床直接搭建在Github上，由于国内网络原因，GitHub 的链接经常超时，使用 lighthouse 评估自己的网站性能差到离谱 ┭┮﹏┭┮ ~~
现在使用 Picgo + 腾讯云 COS 作为图床，就很方便的解决了图片加载慢的问题 (●'◡'●)
参考链接：https://blog.csdn.net/XiaoFan012/article/details/157342695

Picgo + 腾讯云 COS 搭建图床

2026-03-04

博客优化

已提交

添加日历组件与首页信息层次调整

添加日历组件展示每日记录
添加每日记录分类标签

更好记录自己学习，防止偷懒，自律！自律！自律！(ง •_•)ง。

大模型学习

2026-04-13

大模型学习

已提交

大模型架构 - 面经八股

系统整理了大模型架构面试知识，覆盖 Attention 的核心思想、QKV 计算流程、Self-Attention / Cross-Attention 区别、padding mask 与常见长序列 Attention 优化方法。
梳理了 Transformer 与 BERT 相关高频问题，包括多头注意力降维、缩放点积、Encoder / Decoder mask 差异、BERT 输入表示、MLM / NSP、[CLS]、warm-up 和长文本处理。
补充了 MHA、MQA、GQA 与 FlashAttention 的核心原理，重点理解 KV Cache、推理效率、uptraining、IO-aware tiling、online softmax 与反向重计算。

完成大模型架构面试知识整理，串联 Attention、Transformer、BERT、MHA/MQA/GQA 与 FlashAttention 等重点内容。

2026-04-12

大模型学习

已提交

大语言模型基础 - 面经八股

系统整理了大语言模型基础面试知识，包括 LLM 概念、主流开源模型体系、Transformer 预训练范式、Causal LM、Prefix LM 与 Encoder-Decoder 的区别。
复习了 Decoder-only 成为主流的原因、训练目标、涌现能力、复读机问题、长上下文处理方式，以及 BERT、GPT、ELMo、Word2Vec 等 NLP 基础内容。
补充了激活函数相关八股，梳理 Sigmoid、Tanh、ReLU 系列、GELU、Swish 与 GLU 的特点和优缺点。

完成大语言模型与 NLP 面试基础知识整理，串联模型架构、训练目标、长上下文、激活函数和经典预训练模型等重点。

2026-04-02

大模型学习

已提交

预训练模型 - HappyLLM

今天预训练模型部分，了解了不同模型架构的预训练目标和训练方法以及大模型的发展历程。
三大架构的核心代表：Encoder-Only 以 BERT 为代表，Encoder-Decoder 以 T5 为代表，Decoder-Only 以 GPT、LLaMA、GLM 为代表。
初步理解了三大架构的设计差异和他们的预训练目标

2026-03-31

大模型学习

已提交

Transformer - HappyLLM

今天看了HappyLLM中的Encoder、Decoder、Embedding、Position Encoding部分，了解了Transformer模型的核心模块原理与代码实现。
实现了代码手撕，搭建了 Transformer 模型。
狠狠避雷 WPS 云盘写笔记，一直丢失内容 (╬▔皿▔)凸~

2026-03-28

大模型学习

已提交

Transformer - HappyLLM

今天学习了 Seq2Seq 模型、前馈神经网络、层归一化的核心模块原理与代码实现。
实现了代码手撕
后续也会对存在的疑问进行梳理和总结

2026-03-17

大模型学习

已提交

注意力机制（补充） - HappyLM

今天学习了 HappyLLM 中的自注意力、掩码注意力、多头注意力部分
实现了代码手撕
对其中存在疑惑的地方进行了梳理和总结
HappyLLM 项目链接：https://github.com/datawhalechina/happy-llm

梳理自注意力、掩码注意力、多头注意力的核心思想、QKV 计算过程、代码实现

2026-03-15

大模型学习

已提交

注意力机制 - HappyLM

今天学习了 HappyLLM 中的注意力机制相关内容
后续会学习注意力机制中的自注意力、多头注意力等部分
HappyLLM 项目链接：https://github.com/datawhalechina/happy-llm

梳理注意力机制的核心思想、QKV 计算过程、代码实现

2026-03-14

大模型学习

已提交

MedicalGPT：第一阶段：PT/SFT/DPO 单卡跑通指南

今天跑通了基于 MedicalGPT 模型的 PT+SFT+DPO 全阶段
后续会在此基础上进行打磨优化
MedicalGPT 项目链接：https://github.com/shibing624/MedicalGPT?tab=readme-ov-file

基于 MedicalGPT，在单卡（16GB显存）环境下跑通 PT+SFT+DPO 全链路训练

2026-03-13

大模型学习

已提交

NLP基础概念 - HappyLM

今天学习了 HappyLLM 中的 NLP 基础概念
HappyLLM 项目链接：https://github.com/datawhalechina/happy-llm

涵盖 NLP 任务、文本表示方法（VSM、N-gram、Word2Vec、ELMo）等核心知识。

2026-03-11

大模型学习

已提交

准备CS336大模型课程

课程总览。

算法学习之路漫漫，慢慢来，不急不躁！(ง •_•)ง。

科研生活

2026-05-03

科研生活

已提交

本地服务公网发布、Mihomo 代理与 RustDesk 自建记录

梳理了如何通过 Caddy + FRP + CLIProxyAPI，将本地高性能主机上的 AI 服务安全发布到公网，并统一交给 HTTPS 域名入口管理。
整理了 Linux 主机上 Mihomo 的本机代理方案，包括常驻运行、仅监听本地回环地址，以及通过 pon / poff 控制当前 shell 的代理开关。
记录了 RustDesk Server OSS 在云服务器上的手动部署流程，涵盖端口放行、systemd 配置、公钥获取与客户端接入。

围绕本地服务公网发布、Linux 代理配置和 RustDesk 自建部署，整理了三篇可复用的运维实践记录。

2026-03-29

科研生活

已提交

VSCode 服务器代理配置 - Codex 插件可用

解决VSCode连接服务器后, 终端代理正常但Codex插件无法联网的问题;
配置VSCode SSH config反向隧道, 修改远端设置, 最终实现Codex插件正常使用。
记录完整操作步骤，方便后续遇到同类问题快速复用。

2026-03-20

科研生活

已提交

计算机基础知识日常记录

记录计算机基础知识
export http_proxy=http://127.0.0.1:xxx 到底是什么意思？

记录日常遇到的计算机基础知识、学习困惑及解答要点，日积月累，夯实基础。

算法学习

2026-04-03

算法学习

已提交

栈与队列 - 代码随想录

系统整理了《代码随想录》栈与队列专题，补全用栈实现队列、用队列实现栈、有效括号、删除相邻重复项、逆波兰表达式求值等题型。
重点梳理了单调队列在滑动窗口最大值中的维护逻辑，以及优先队列 / 小顶堆在前 K 个高频元素中的应用。

完成《代码随想录》栈与队列专题博客整理，串联栈匹配、表达式求值、单调队列和优先队列的核心思路。

2026-04-02

算法学习

已提交

字符串 - 代码随想录

系统整理了《代码随想录》字符串专题，补全了字符串反转、分段反转、单词翻转、右旋字符串、KMP 与重复子串判断等题型。
重点重新梳理了 KMP 中 next 数组的定义、失配回退逻辑，以及重复子串判断的判定条件。

完成《代码随想录》字符串专题博客整理，串联双指针、分段处理、整体反转与 KMP 的核心思路。

2026-04-01

算法学习

已提交

哈希表 - 代码随想录

复习了哈希表的基本原理、常见实现方式（链地址法、开放地址法）以及常见的哈希函数设计。
手撕了有效字母异位词、交集、快乐数、两数之和、四数相加、赎金信、三数之和等经典题型。

2026-03-12

算法学习

已提交

学习了《代码随想录》链表部分

虚拟头结点、双指针、快慢指针、链表反转、相交与环入口。

算法学习之路漫漫，慢慢来，不急不躁！(ง •_•)ง。

2026-03-04

算法学习

已提交

学习了《代码随想录》数组部分

复习了二分查找、双指针、滑动窗口、前缀和
OS：之前的内容基本忘完了/(ㄒoㄒ)/~~，每天复习一部分代码随想录，准备算法学习。

算法学习之路漫漫，慢慢来，不急不躁！(ง •_•)ง。

论文阅读

2026-03-27

论文阅读

已提交

《Deep Multimodal Learning with Missing Modality - A Survey》

今天继续阅读了这篇有关模态缺失综述的第四章，了解了多模态学习中缺失模态问题的解决方法和应用场景。
同时梳理了现有的多模态 Transformer 架构
发现现如今大多都是简单的将不同模态的 Token 进行拼接，然后喂入一个共享的 Transformer 模型中处理
Cross-modal attention 机制的设计也比较简单，主要是通过在 Transformer 中引入跨模态注意力层来实现不同模态之间的信息交互

2026-03-18

论文阅读

已提交

《Deep Multimodal Learning with Missing Modality - A Survey》

今天阅读了这篇有关模态缺失综述的前三章，了解了多模态学习中缺失模态问题的研究现状和挑战。
论文链接:https://openreview.net/forum?id=tc7RFcx4hT
后续会继续阅读剩余章节，深入了解解决缺失模态问题的方法和应用场景。
已经很久没有读过文献了，自己阅读能力有非常大的不足，后续会继续努力提升自己的阅读能力。

多模态学习中缺失模态问题的研究现状和挑战，以及解决方法和应用场景。

每日记录

博客优化

大模型学习

科研生活

算法学习

论文阅读

Mr.L