每日记录

博客优化

2026-03-12
博客优化
已提交
Picgo + 腾讯云 COS 图床配置
  • 之前图床直接搭建在Github上,由于国内网络原因,GitHub 的链接经常超时,使用 lighthouse 评估自己的网站性能差到离谱 ┭┮﹏┭┮ ~~
  • 现在使用 Picgo + 腾讯云 COS 作为图床,就很方便的解决了图片加载慢的问题 (●'◡'●)
  • 参考链接:https://blog.csdn.net/XiaoFan012/article/details/157342695

Picgo + 腾讯云 COS 搭建图床

2026-03-04
博客优化
已提交
添加日历组件与首页信息层次调整
  • 添加日历组件展示每日记录
  • 添加每日记录分类标签

更好记录自己学习,防止偷懒,自律!自律!自律!(ง •_•)ง。

大模型学习

2026-04-02
大模型学习
已提交
预训练模型 - HappyLLM
  • 今天预训练模型部分,了解了不同模型架构的预训练目标和训练方法以及大模型的发展历程。
  • 三大架构的核心代表:Encoder-Only 以 BERT 为代表,Encoder-Decoder 以 T5 为代表,Decoder-Only 以 GPT、LLaMA、GLM 为代表。
  • 初步理解了三大架构的设计差异和他们的预训练目标
2026-03-31
大模型学习
已提交
Transformer - HappyLLM
  • 今天看了HappyLLM中的Encoder、Decoder、Embedding、Position Encoding部分,了解了Transformer模型的核心模块原理与代码实现。
  • 实现了代码手撕,搭建了 Transformer 模型。
  • 狠狠避雷 WPS 云盘写笔记,一直丢失内容 (╬▔皿▔)凸~
2026-03-28
大模型学习
已提交
Transformer - HappyLLM
  • 今天学习了 Seq2Seq 模型、前馈神经网络、层归一化的核心模块原理与代码实现。
  • 实现了代码手撕
  • 后续也会对存在的疑问进行梳理和总结
2026-03-17
大模型学习
已提交
注意力机制(补充) - HappyLM
  • 今天学习了 HappyLLM 中的自注意力、掩码注意力、多头注意力部分
  • 实现了代码手撕
  • 对其中存在疑惑的地方进行了梳理和总结
  • HappyLLM 项目链接:https://github.com/datawhalechina/happy-llm

梳理自注意力、掩码注意力、多头注意力的核心思想、QKV 计算过程、代码实现

2026-03-15
大模型学习
已提交
注意力机制 - HappyLM
  • 今天学习了 HappyLLM 中的注意力机制相关内容
  • 后续会学习注意力机制中的自注意力、多头注意力等部分
  • HappyLLM 项目链接:https://github.com/datawhalechina/happy-llm

梳理注意力机制的核心思想、QKV 计算过程、代码实现

2026-03-14
大模型学习
已提交
MedicalGPT:第一阶段:PT/SFT/DPO 单卡跑通指南
  • 今天跑通了基于 MedicalGPT 模型的 PT+SFT+DPO 全阶段
  • 后续会在此基础上进行打磨优化
  • MedicalGPT 项目链接:https://github.com/shibing624/MedicalGPT?tab=readme-ov-file

基于 MedicalGPT,在单卡(16GB显存)环境下跑通 PT+SFT+DPO 全链路训练

2026-03-13
大模型学习
已提交
NLP基础概念 - HappyLM
  • 今天学习了 HappyLLM 中的 NLP 基础概念
  • HappyLLM 项目链接:https://github.com/datawhalechina/happy-llm

涵盖 NLP 任务、文本表示方法(VSM、N-gram、Word2Vec、ELMo)等核心知识。

2026-03-11
大模型学习
已提交
准备CS336大模型课程
  • 课程总览。

算法学习之路漫漫,慢慢来,不急不躁!(ง •_•)ง。

科研生活

2026-05-03
科研生活
已提交
本地服务公网发布、Mihomo 代理与 RustDesk 自建记录
  • 梳理了如何通过 Caddy + FRP + CLIProxyAPI,将本地高性能主机上的 AI 服务安全发布到公网,并统一交给 HTTPS 域名入口管理。
  • 整理了 Linux 主机上 Mihomo 的本机代理方案,包括常驻运行、仅监听本地回环地址,以及通过 pon / poff 控制当前 shell 的代理开关。
  • 记录了 RustDesk Server OSS 在云服务器上的手动部署流程,涵盖端口放行、systemd 配置、公钥获取与客户端接入。

围绕本地服务公网发布、Linux 代理配置和 RustDesk 自建部署,整理了三篇可复用的运维实践记录。

2026-03-29
科研生活
已提交
VSCode 服务器代理配置 - Codex 插件可用
  • 解决VSCode连接服务器后, 终端代理正常但Codex插件无法联网的问题;
  • 配置VSCode SSH config反向隧道, 修改远端设置, 最终实现Codex插件正常使用。
  • 记录完整操作步骤,方便后续遇到同类问题快速复用。
2026-03-20
科研生活
已提交
计算机基础知识日常记录
  • 记录计算机基础知识
  • export http_proxy=http://127.0.0.1:xxx 到底是什么意思?

记录日常遇到的计算机基础知识、学习困惑及解答要点,日积月累,夯实基础。

算法学习

2026-04-02
算法学习
已提交
字符串 - 代码随想录
  • 系统整理了《代码随想录》字符串专题,补全了字符串反转、分段反转、单词翻转、右旋字符串、KMP 与重复子串判断等题型。
  • 重点重新梳理了 KMP 中 next 数组的定义、失配回退逻辑,以及重复子串判断的判定条件。

完成《代码随想录》字符串专题博客整理,串联双指针、分段处理、整体反转与 KMP 的核心思路。

2026-04-01
算法学习
已提交
哈希表 - 代码随想录
  • 复习了哈希表的基本原理、常见实现方式(链地址法、开放地址法)以及常见的哈希函数设计。
  • 手撕了有效字母异位词、交集、快乐数、两数之和、四数相加、赎金信、三数之和等经典题型。
2026-03-12
算法学习
已提交
学习了《代码随想录》链表部分
  • 虚拟头结点、双指针、快慢指针、链表反转、相交与环入口。

算法学习之路漫漫,慢慢来,不急不躁!(ง •_•)ง。

2026-03-04
算法学习
已提交
学习了《代码随想录》数组部分
  • 复习了二分查找、双指针、滑动窗口、前缀和
  • OS:之前的内容基本忘完了/(ㄒoㄒ)/~~,每天复习一部分代码随想录,准备算法学习。

算法学习之路漫漫,慢慢来,不急不躁!(ง •_•)ง。

论文阅读

2026-03-27
论文阅读
已提交
《Deep Multimodal Learning with Missing Modality - A Survey》
  • 今天继续阅读了这篇有关模态缺失综述的第四章,了解了多模态学习中缺失模态问题的解决方法和应用场景。
  • 同时梳理了现有的多模态 Transformer 架构
  • 发现现如今大多都是简单的将不同模态的 Token 进行拼接,然后喂入一个共享的 Transformer 模型中处理
  • Cross-modal attention 机制的设计也比较简单,主要是通过在 Transformer 中引入跨模态注意力层来实现不同模态之间的信息交互
2026-03-18
论文阅读
已提交
《Deep Multimodal Learning with Missing Modality - A Survey》
  • 今天阅读了这篇有关模态缺失综述的前三章,了解了多模态学习中缺失模态问题的研究现状和挑战。
  • 论文链接:https://openreview.net/forum?id=tc7RFcx4hT
  • 后续会继续阅读剩余章节,深入了解解决缺失模态问题的方法和应用场景。
  • 已经很久没有读过文献了,自己阅读能力有非常大的不足,后续会继续努力提升自己的阅读能力。

多模态学习中缺失模态问题的研究现状和挑战,以及解决方法和应用场景。

引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體