工程、网络与系统设计

把日常问题拆开来看,很多复杂系统就会变得清晰。

这里记录一些偏工程实践的文章,包括静态站点搭建、网络链路治理、服务稳定性优化,以及一些轻量但持续有效的开发习惯。

最近更新

三篇适合慢慢读的技术文章

一次跨区域链路的稳定性复盘

远程访问链路看起来只是“能不能连通”,但真正决定体验的是中间每一跳的可恢复性。把入口、中转和落地点拆分治理后,问题定位效率会明显提升。

阅读摘要

服务上线前,先准备一份最小排障手册

一份好的运维速查不需要长,但一定要包含目录、容器名、端口、常用命令和常见报错。真正出问题时,能省下来的不是几分钟,而是认知切换的成本。

阅读摘要

为什么信息型网页要先照顾可读性

技术内容页面首先是一种阅读界面。只要层级明确、留白克制、段落密度合理,页面就会显得可信;过度装饰反而会削弱信息本身。

阅读摘要

技术短笺

一些简单但经常有效的经验

01

页面先稳定,再逐步精细化

首页的首要目标是可访问、可阅读、可被搜索引擎正确识别。等基础链路稳定之后,再加入更复杂的交互与自动化发布流程,成本会更低。

02

技术文档最好能让值班的人在三分钟内上手

任何需要来回翻聊天记录才能找到的命令,本质上都还不算文档。把关键路径、命令示例和预期现象写清楚,文档才真正开始发挥价值。

03

监控不只是报警,更是建立“正常状态”的样本

很多排障之所以困难,不是因为没有错误日志,而是没人知道系统平时正常时长什么样。先画出基线,异常才会真正显眼。