参数估计:最大似然估计 (Maximum Likelihood Method – MLM) Ⅱ

上一篇讲最大似然估计的文章有一些读者反映看不太懂,也有读者提出了很多很好的问题。上一篇文章跟大家大概讲了一下最大似然估计的用法,这一篇会更加具体地带例题解释,并且解答大家的疑惑。

似然函数(Likelihood Function)的公式:

这里质量函数的似然函数很好理解,不过为什么密度函数的似然函数也只需要相乘呢?

我们首先要理解,使用参数估计的前提是我们已经有了数据。收集到了数据,建立了统计模型之后,根据我们已有的数据来估计这个模型的参数是什么。那应该如何估计参数呢?最大似然估计就假设将我们手中的数据可能性最大化,设一阶导数为零,来获取参数估计。

随机变量分为离散和连续两种,可在实际数据收集的过程中连续的数据都会在某个小数位被四舍五入,因此我的得到数据点x的概率为

X 在这里为数据点x 代表的连续的测量。

因此数据点x的概率和X = x的密度函数形成一定比率,ε 可以被忽略不计。密度函数f(x; θ) 因此被用于似然函数里。

接下来说一个二项分布 (Binomial Distribution) 的例子:

为了调查城市人口的性别,我们从城市人口中抽取一小部分调查询问。

定义二项分布的质量函数为:

p = 是男性的可能性

有很多个数据点,我们得到:

可是我们发现 L(p)这个式子太复杂,都是乘在一起的。

为了方便求一阶导数,我们找 ln(L(p)),

这次查了点资料,又提供了一个简单的例子来解释最大似然估计是如何使用的,希望这次能帮大家解惑。

Reference: “Applied Statistical Inference” by Leonhard Held and Daniel Sabanés Bové

来源:知乎 www.zhihu.com

作者:Lucia

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载