闲窗记语 - 心有山海，静而不争

最近我把本地高性能主机上的 CLIProxyAPI 通过一台有公网 IP 的阿里云 ECS 暴露到了公网，整体方案比“直接开放本地端口”稳妥很多，也更适合长期维护。这篇文章就按实际落地过程，完整记录一下 Caddy + FRP + CLIProxyAPI 的部署思路和操作步骤。一、整体目标我当前有两台机器： A：阿里云 ECS 有公网 IP 负责域名入口、HTTPS 证书、反向代理 B：本地高性能主机没有公网 IP 负责真正运行 CLIProxyAPI 最终链路如下： 12345用户 / Claude Code / 浏览器 ↓ HTTPS阿里云 ECS A（Caddy + frps） ↓ FRP 隧道本地服务器 B（frpc + CLIProxyAPI）最终对外访问地址： 1https://ai.YOUR_DOMAIN 二、为什么不用直接暴露本地服务如果把本地服务器直接发布到公网，通常会遇到几个问题：本地机器没有公网 IP 家宽、校园网、办公网往往都在 NAT 后面 HTTPS 证书、域名解析和端口映射维护麻烦直接暴露本地服 ...

生活札记

未读

Linux 主机 Mihomo 搭建与 pon / poff 代理开关记录

发表于2026-05-03更新于2026-06-20 Mihomo 代理 Linux

最近为了让 Linux 主机能够更稳定地访问 GitHub 和部分外部服务，我重新整理了一套 Mihomo + pon / poff 的本机代理方案。这套方案的重点不是“给全局网络开代理”，而是：只让 Linux 主机自己按需走代理，并且尽量不影响其他本地服务。一、这篇文章要解决什么问题我的目标比较明确： Mihomo 常驻运行只监听本机回环地址不对局域网其他设备开放代理需要时一键打开当前 shell 代理不需要时一键关闭代理最终效果如下： 1234命令行程序（git / curl / apt 等） -> 127.0.0.1:7890 -> Mihomo -> 代理节点也就是说，这套方案主要服务于： git curl apt 终端里的其他联网程序而不会主动影响：局域网其他设备本机对内服务不需要走代理的日常网络访问二、准备条件开始之前，需要具备这些前提： Linux 主机已经可以正常执行 Linux 命令已经拿到一份可用的 Clash / Mihomo 配置已经下载好 Mihomo 二进制，或者准备上传到 ...

RustDesk 自建部署实战：阿里云 ECS 上手动部署 RustDesk Server OSS

生活札记

未读

RustDesk 自建部署实战：阿里云 ECS 上手动部署 RustDesk Server OSS

发表于2026-05-03更新于2026-06-20 RustDesk 远程控制

最近为了让远程控制链路更稳定，也为了摆脱对公共中继服务的依赖，我把 RustDesk Server OSS 单独部署到了自己的阿里云 ECS 上。这篇文章按实际操作过程，完整记录一下 RustDesk 服务端手动部署的步骤。整套方案不依赖 Docker，也不使用 Pro 安装脚本，更适合自己长期维护和排查问题。一、这篇文章适合什么场景如果你符合下面这些情况，这篇文章应该会比较有参考价值：手里有一台公网 Linux 服务器想搭建自己的 RustDesk 服务端不想依赖官方公共服务器希望通过自己的域名接入客户端更偏好“原生二进制 + systemd”的部署方式本文采用的是 RustDesk Server OSS 原生二进制手动部署。二、整体架构最终架构比较简单： 1234RustDesk 客户端 -> rustdesk.YOUR_DOMAIN -> 阿里云服务器 -> hbbs + hbbr 其中： hbbs：负责 ID / rendezvous hbbr：负责 relay 三、为什么选择手动部署我一开始尝试过其他方式，比如： ...

大模型研习

面经八股

未读

Attention - 面经八股

发表于2026-04-13更新于2026-04-13 Transformer BERT 大模型架构 Attention MHA MQA GQA FlashAttention 面试八股

Attention 本文整理大模型架构面试高频知识，重点覆盖 Attention 的计算逻辑、Transformer 的核心模块、BERT 的预训练与输入表示、MHA / MQA / GQA 的推理效率差异，以及 FlashAttention 的显存与 IO 优化思想。 Attention 谈谈你对 Attention 的理解？ Attention 的核心思想是：在处理一个 token 或生成一个输出时，不是平均看所有输入，而是根据当前需要，动态地关注更重要的信息。在 NLP 任务中，一个句子里的不同词对当前预测的重要性是不一样的。比如机器翻译时，生成某个目标词时，模型应该重点关注源句中和它语义对应的词；做问答时，模型应该重点关注和问题相关的上下文片段。Attention 就是让模型自动学习“该看哪里、看多少”。从直观上理解，Attention 会为输入序列中每个位置分配一个权重。权重越大，说明当前位置对当前输出越重要。然后模型会对这些位置的表示做加权求和，得到一个融合后的上下文表示。在 Transformer 里，Attention 通常通过 Q、K、V 来实现： ...

大模型研习

面经八股

未读

大语言模型基础 - 面经八股

发表于2026-04-12更新于2026-04-12 LLM Transformer NLP BERT GPT 面试八股大语言模型

大语言模型基础本篇整理大模型与 NLP 面试高频基础知识，重点记录概念辨析、模型架构、训练目标、长上下文、激活函数与经典预训练模型等内容。 LLM概念 Q0：什么是大语言模型？大模型 LLM 是一种基于 Transformer 的大规模预训练语言模型。它通过在海量文本语料上学习语言分布，获得文本理解、生成、推理和知识表达能力。当前主流 LLM 通常采用 Decoder-only 架构，通过 next token prediction 进行训练。经过指令微调和人类偏好对齐后，模型可以更好地理解用户指令，并应用在问答、对话、摘要、代码生成、RAG 和 Agent 等场景中。 Q1: 目前主流的开源模型体系有哪些？目前主流的开源或开放权重大模型体系，我会按模型家族来理解，而不是只按单个模型名称来背。比较典型的有 LLaMA、Qwen、DeepSeek、Mistral、Gemma、Phi 等。 LLaMA 系列是 Meta 推出的开放权重模型体系，生态非常成熟，社区微调、量化、推理框架支持都很完善，很多模型和工具链都兼容 LLaMA 架构。Meta 在 Llama 4 中 ...

大模型研习

未读

大语言模型 - HappyLLM

发表于2026-04-11更新于2026-06-20 LLM 大语言模型预训练 SFT RLHF 分布式训练预训练语料

随着2022年底 ChatGPT 刷新 NLP 的能力上限，大语言模型开始接替传统的预训练语言模型（Pre-trained Language Model，PLM）成为 NLP 的主流方向，基于 LLM 的全新研究范式正刷新被 BERT 发扬光大的预训练-微调范式，NLP 迎来又一次翻天覆地的变化。究竟什么是 LLM，LLM 和传统的 PLM 的核心差异在哪里，又是什么令研究者对 LLM 抱有如此高的热情与期待呢？在本文中，将深入分析 LLM 的定义、特点及其能力，揭示 LLM 与传统深度学习模型的核心差异，展示LLM 的实际三阶段训练过程。 LLM的定义 LLM（Large Language Model，大语言模型），是一种相较传统语言模型参数量更多、在更大规模语料上进行预训练的语言模型。 LLM 使用与传统预训练语言模型相似的架构与预训练任务（如 Decoder-Only 架构与 CLM 预训练任务），但拥有更庞大的参数、在更海量的语料上进行预训练，从而展现出与传统预训练语言模型截然不同的能力。随着 LLM 研究的不断深入，多参数尺寸的 LLM 逐渐丰富，广义 LLM 一 ...

算法学习

未读

栈与队列 - 代码随想录

发表于2026-04-03更新于2026-04-03 代码随想录算法数据结构栈队列单调队列优先队列堆

栈与队列栈与队列刷题记录，基于代码随想录整理，重点关注括号匹配、表达式求值、单调队列和优先队列等常见题型。快速索引 232 用栈实现队列（输入栈 + 输出栈） 225 用队列实现栈（队列 / 双端队列模拟） 20 有效的括号（栈匹配） 1047 删除相邻重复项（栈消消乐） 150 逆波兰表达式求值（操作数栈） 239 滑动窗口最大值（单调队列） 347 前 K 个高频元素（小顶堆） 232. 用栈实现队列问题描述请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作（push、pop、peek、empty）：实现 MyQueue 类： void push(int x) 将元素 x 推到队列的末尾 int pop() 从队列的开头移除并返回元素 int peek() 返回队列开头的元素 boolean empty() 如果队列为空，返回 true ；否则，返回 false 说明：你只能使用标准的栈操作 —— 也就是只有 push to top, peek/pop from top, size, 和 is empty 操作是合法的。你 ...

大模型研习

未读

预训练模型 - HappyLLM

发表于2026-04-02更新于2026-06-20 LLM Transformer Happy-LLM 预训练语言模型 Encoder-Only Decoder-Only Encoder-Decoder BERT GPT LLaMA GLM

预训练语言模型 Encoder-only PLM Transformer 结构主要由 Encoder、Decoder 两个部分组成，两个部分分别有不一样的结构和输入输出。针对 Encoder、Decoder 的特点，引入 ELMo 的预训练思路，开始出现不同的、对 Transformer 进行优化的思路。例如： Google 选择了 Encoder 层，通过将 Encoder 层进行堆叠，提出不同的预训练任务-掩码语言模型（Masked Language Model，MLM），打造了自然语言理解（Natural Language Understanding，NLU）任务的代表模型——BERT。 OpenAI 则选择了 Decoder 层，使用原有的语言模型（Language Model，LM）任务，通过不断增加模型参数和预训练语料，打造了在自然语言生成（Natural Language Generation，NLG）任务上的 GPT 系列模型。 Google 发布的 T5 模型同时保留 Encoder 与 Decoder，打造预训练的 Transformer 模型。在本小节 ...

算法学习

未读

字符串 - 代码随想录

发表于2026-04-02更新于2026-04-02 代码随想录算法数据结构双指针字符串 KMP

字符串字符串刷题记录，基于代码随想录整理。快速索引方法分组 344 反转字符串（双指针） 541 反转字符串 II（分段处理）模拟替换数字（遍历构造） 151 反转字符串中的单词（去空格 + 整体反转 + 单词反转）右旋右旋字符串（整体反转） 28 找出字符串中第一个匹配项的下标（KMP） 459 重复的子字符串（KMP）双指针：344、151 模拟分段处理：541、替换数字、右旋字符串 KMP：28、459 344. 反转字符串问题描述编写一个函数，其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。示例 1： 12输入：s = ["h","e","l","l","o"]输出：["o","l","l","e","h"] 示例 2： ...

算法学习

未读

哈希表 - 代码随想录

发表于2026-04-01更新于2026-04-04 代码随想录算法数据结构哈希表双指针

哈希表 242. 有效的字母异位词问题描述给定两个字符串 s 和 t ，编写一个函数来判断 t 是否是 s 的字母异位词。示例 1: 12输入: s = "anagram", t = "nagaram"输出: true 示例 2: 12输入: s = "rat", t = "car"输出: false 提示: 1 <= s.length, t.length <= 5 * 104 s 和 t 仅包含小写字母进阶: 如果输入字符串包含 unicode 字符怎么办？你能否调整你的解法来应对这种情况？思路数组其实就是一个简单哈希表，且这道题目中字符串只有小写字符，那么就可以定义一个大小为 26 的数组（字符a到字符z的ASCII是26个连续的数值），记录字符串s里字符出现的次数。遍历字符串 s 时，将 s[i] - ‘a’ 所在的元素做+1 操作即可；同样遍历字符串 t 时，将 t[i] - ‘a’ 所在的元素做-1 操作即可；数组若存在元素不为0，说明字符串s和 ...

Mr.L