贝叶斯公式

一个有5个选择的考题,其中只有一个选择正确的。假定应考人知道正确答案的概率为p=1/3。如果他最后选对了,问他确实知道答案的概率是多少?

这个题目在我刚开始学概率的时候就总让身边的人做。为什么答案不是1/3呢?当我们考试时,如果一道选择题只有三成的把握是知道答案的,那么我们即使不会解答也不可能空在那边,而是会猜一个答案填上去。我们要讨论的就是他解出题目究竟是「做对」的还是「猜对」的。

贝叶斯公式又叫逆概公式,用来由试验结果(也就是题中的「答对了」)推测原因(也就是「确实知道答案的概率」),也可以讲用来「求来源」。

题目的解答过程是,首先,有两种情况可能会导致他做对,一种是他知道答案,另一种是他不知道答案但是猜对了。前面一种情况的概率是1/3,后面一种情况,用一下乘法公式,是(2/3)*(1/5),于是做对的总概率就是(1/3+(2/3)*(1/5))。其中,1/3的概率是「做对」的,于是他「确实知道答案」的概率就是(1/3)/(1/3+(2/3)*(1/5))=5/7,而当p增大到1/2时,他确实知道答案的概率就变成了5/6。套用老师上课时给我们的结论:这说明老师们依据试卷成绩来衡量学生平时的学习状况还是有科学依据的。

使用贝叶斯可以解决的现实问题还比如:

深夜,一辆出租车被牵扯进一起交通事故,该市有两家出租车公司—-红色出租车公司和蓝色出租车公司,其中蓝色出租车公司和红色出租车公司分别占整个城市出租车的85%,15%。据现场目击者说,事故现场的出租车是红色的。经测试该目击证人的辨别能力,测得他辨认的正确率为80%。于是,警察就认定红色出租车具有较大的肇事嫌疑。试问,警察的认定对红色出租车是否公平。

回答是很不公平,因为根据计算,「确实是红色出租车肇事」的概率仅为0.41,要查也该查蓝色出租车。不过由于红色和蓝色的概率比较接近,所以这个目击者提供的证据其实没有什么价值。