5秒導讀:本文將介紹極大似然法與Logistic回歸的極大似然函數(shù),用Logistic回歸求追女神的概率,都說女人心海底針,今天我們就來大海撈針
這是玩ai的第8期,回頭一看,沒想到當初挖的大坑已經(jīng)填的差不多了(由此可見明日麗科技還是很有效率的),不過玩ai系列還會繼續(xù)。
最后說一句廢話,如果您還不了解Logistic回歸,請看公眾號第一篇文章《大數(shù)據(jù)AI改變生活—Logistic回歸告訴你追到女神的概率(上)》,OK讓我們開始今天的主題——極大似然法。
所謂極大似然法,就是基于使樣本出現(xiàn)的機率最大化的準則求概率的方法。這話確實很繞口,而且好像說了等于沒說,不過沒事,讓我們看例子,從lo服開始!
假如你想知道lo服的受歡迎程度,該怎么辦?很簡單,首先請穿上lo服到街上繞一圈,然后隨機向10個路人詢問。
現(xiàn)在假設有7個人喜歡,3個人不喜歡,請問人們喜歡lo服的概率多大?想都不用想0.7嘛
沒錯,確實是0.7,不過我們還是把事情說的嚴謹些。假設路人喜歡lo服的概率是P,那么發(fā)生7個人喜歡,3個人不喜歡的概率就是(請注意這里是按照順序來的,如果忽略順序就必須多乘上一個組合數(shù)):
上面的式子就叫做似然函數(shù)
因為不可能抓著所有人問一遍:“你是否喜歡lo服?”, 所以現(xiàn)在我們考慮,P取什么值,可以使似然函數(shù)取最大值。也就是說,人們喜歡lo服的概率多大,才最容易發(fā)生7人喜歡3人不喜歡的情況。
Ok,怎么求該函數(shù)的最大值呢,一種辦法是找導數(shù)為0的點,但是對不起!上述函數(shù)求導后是一個6次的方程,抽象代數(shù)的東西,我們還是暫時不碰的好。因為不碰6次方程我們還有別的辦法。取對數(shù)!
化簡一下可得7ln(p)+3ln(1-p),求導后得
當P=0.7時,此導函數(shù)確實為0,這里求導用了鏈式法則,導數(shù)為0的點也不一定是極值點,但是.......不要在意這些細節(jié)!
OK,現(xiàn)在說回Logistic回歸,我們還記得把自身條件表示的向量,與各個條件在女神心中的權(quán)重做點乘,再帶入Sigmoid函數(shù),得到的就是追求女神成功的概率。不過,女人心海底針,要知道權(quán)重,必須得有點技術才行!
首先我們可以通過大數(shù)據(jù)收集大量的信息。令第i君自身條件為:
將追女神是否成功表示為(其中1為成功0為失敗):
h(x)表示i君的條件與女神心中權(quán)重的點乘帶入Sigmoid函數(shù)。那么把所有h(x)相乘,就代表了樣本出現(xiàn)的概率也就是似然函數(shù)。把似然函數(shù)取對數(shù),再整理一下就可以得到:
而使上述函數(shù)取得最大值的θ, 就是各個條件在女神心中的權(quán)重!這個推導和上面的lo服是一回事,只是寫著復雜!至于為什么?因為這里的θ是女神對配偶各個條件的重視程度!女人心海底針,大海撈針有不難的么?
至于怎么求使函數(shù)取最大值的θ——梯度上升,還記得前面的梯度下降么?倒回去看看就知道了,只是從下山改為爬山而已!
關注我們,獲取更多有關 AI與大數(shù)據(jù)的信息,ASRay明日麗科技——科技助力企業(yè)發(fā)展,攜手共創(chuàng)更美明天!





暫無評論,快來評論吧!