有時辰我們在利用Python的時辰,想進行相關性闡發,怎么闡發呢,下面來分享一下方式
第一步我們起首需要知道相關性本家兒要有兩個偏向,一個是正偏向一個是負偏向,相關性系數是權衡兩個變量之間影響水平,如下圖所示:
第二步下面經由過程公式計較兩個變量之間相關性系數,代碼如下:
import numpy
import pandas
X = [52,19,7,33,2]
Y = [162,61,22,100,6]
#公式計較#均值XMean = numpy.mean(X)
YMean = numpy.mean(Y)
#尺度差XSD = numpy.std(X)
YSD = numpy.std(Y)
#z分數ZX = (X-XMean)/XSD
ZY = (Y-YMean)/YSD#相關系數
r = numpy.sum(ZX*ZY)/(len(X))
print(r)
第三步運行法式,可以獲得相關性系數r ,r的值是0.999674032661831,相關性很是高,如下圖所示:
第四步我們也可以經由過程numpy的corrcoef方式計較相關性系數,輸入代碼
t=numpy.corrcoef(X,Y)
print(t)
可以看到X與Y和Y與X的相關性系數,如下圖所示:
第五步我們也可以經由過程pandas的corr方式計較相關性系數,代碼
data = pandas.DataFrame({'X':X,'Y':Y})
t2=data.corr()
print(t2)
獲得了不異的成果,如下圖所示:
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!