系统日知录

作者

青藤木鸟

351
读者
118
内容

《系统日知录》会持续更新数据库、分布式系统、存储、ML System 相关的想法、翻译、笔记和文章,通过深入浅出的持续解析,帮助业务开发程序员建立底层知识体系。 写代码不是全部,系统是综合学问。 不谋全局者,不足谋一域; 不学系统者,不足学编程。 专栏是买断制,在保证每篇文章的知识密度的基础上,持续不定期更新。会随缘将一些文章分享到公众号:“木鸟杂记”。关注该公众号后回复:“优惠券”,可以领取本专栏八折优惠券。 关于专栏内容,想交流可以留言、也可加我微信 qtmuniao。有个交流群,如果想加群可备注。

全部文章
作者青藤木鸟头像

青藤木鸟

2025/05/20

使用 ray.data 进行大规模数据处理(三):优化规则

ray.data 是基于 ray core 的一层封装。依赖 ray.data,用户用简单的代码,就可以实现数据大规模的异构处理(主要指同时使用 CPU 和 GPU)。一句话......

作者青藤木鸟头像

青藤木鸟

2025/05/17

infra 面试之数据结构九:并行迭代

前面的面试题基本都是一堆 C++,毕竟传统 Infra 开发讲求高性能,一般都用 C++ 和 Rust。但随着 AI 相关的 Infra 兴起,Python 的地位也越来越重要。正好,最近写 P......

作者青藤木鸟头像

青藤木鸟

2025/03/31

【每天学点数据库】Lecture #15:并发控制

内容主要来自 CMU 15445 Fall 2022 的课程讲义和授课视频,结合笔者的一些内核开发实践,形成一系列相对独立、但又相对勾连的小文。如果你对数据库内核开发感兴趣,......

作者青藤木鸟头像

青藤木鸟

2025/03/17

在云上进行大规模数据处理的一些实践

随着云基础设施的不断成熟,新兴的公司为了快速实现业务目标,一般都会让基础设施上云。而在云上进行开发与传统上直接使用物理机开发其实有很大不同。云上更强调共享和弹性,此外,规模变大又会带来隔离性。这......

作者青藤木鸟头像

青藤木鸟

2024/12/08

t-SNE :一种“降维不扰邻”的有趣算法

背景

考虑这样一个场景,你有一大堆千奇百怪的图片,想将其分门别类,并能够在分类好之后证明你分的类确实不错。

当数据量很小时(比如几百个),你可以定个分类的标准,然后找些人来按照标准分一......

作者青藤木鸟头像

青藤木鸟

2024/10/27

深度学习入门小话 —— 卷积的由来

从上学时开始就多次尝试入门深度学习,但总徘徊门外而不得入。近来有一些工作上的体感,加之李沐老师的这门好课,终于对以前困惑的点有所感悟。

因此,本系列定位是 b 站上李沐老师主讲的《动......

作者青藤木鸟头像

青藤木鸟

2024/10/05