1

Hoeffding 不等式(霍夫丁不等式)简介

 3 years ago
source link: https://blog.popkx.com/Hoeffding-inequality-introdution/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Hoeffding 不等式(霍夫丁不等式)简介

发表于 2021-04-23 09:04:00   |   已被 访问: 17 次   |   分类于:   统计算法   |   暂无评论

霍夫丁(Hoeffding)不等式

内容主要来自网络上的各个博客。

从一个装有绿色和黄色的罐子里随机地摸出小球,根据摸出小球的概率来估计整个罐子中绿色球和黄色球的所占的比例。

那么当抽出的样本数越多,最终预测出的绿球占整个罐子中小球的概率 uuu 会越趋近于实际罐子中绿色小球占整个罐子小球的概率 vvv。

P(∣v−u∣<ϵ)≤2⋅e−2⋅ϵ2⋅N\mathbb P(\left | v-u \right |<\epsilon) \leq 2\cdot e^{-2\cdot \epsilon^2 \cdot N}P(∣v−u∣<ϵ)≤2⋅e−2⋅ϵ2⋅N

所以就有了霍夫丁不等式,在一个含有 NNN 个样本数(NNN 足够大)的数据集中,在误差允许的范围内,uuu 和 vvv 可以不断地靠近。左侧的概率随着 NNN 的增大而减少,所以,要减少预测和实际之间的误差,就要增大样本数量。

根据目前搜集到的资料,霍夫丁(Hoeffding)不等式似乎适用于符合伯努利分布的问题,因此基础的证明思路如下:

后面补吧,暂时有事。

阅读更多:   统计算法


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK