Kullback–Leibler divergence
介绍 KL 散度(Kullback-Leibler divergence)的定义、离散与连续版本的公式,以及其在衡量两个概率分布差异性中的核心作用。
1317 字
|
7 分钟
Text Generator With Transformer Decoder
利用 Transformer Decoder 从零实现一个简单的文本生成器,涵盖数据构造、Mask Attention、Positional Encoding 等核心组件的代码实现。
1857 字
|
9 分钟
AUC & GAUC
深入讲解 AUC 和 GAUC 的概念与计算方法,以及 AUC 作为衡量正负样本排序能力的统计含义,从 ROC 曲线到实际应用。
2324 字
|
12 分钟
GAN Loss Derivation
从 Generator 与 Discriminator 的目标出发,逐步推导 GAN 损失函数,并说明 min-max 形式背后的直觉。
579 字
|
3 分钟
Sampling Method
介绍蒙特卡洛采样方法及其在参数估计中的应用,涵盖逆变换采样、拒绝采样等核心技术的原理与多臂老虎机场景下的实践。
1559 字
|
8 分钟
Gama&Beta&Dirichlet
总结 Gamma 分布、Beta 分布和 Dirichlet 分布的定义、性质及其之间的内在联系,帮助梳理概率分布之间的脉络关系。
2093 字
|
10 分钟
Probability Calibration
介绍分类模型中的概率校准方法,包括校准曲线的绘制以及逻辑回归、贝叶斯、随机森林等模型在校准表现上的差异与原因分析。
1639 字
|
8 分钟
Perplexity
深入浅出地解释 NLP 中困惑度(Perplexity)的概念,理解它如何衡量语言模型对样本的预测能力,以及其与概率的关系。
979 字
|
5 分钟