您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
03 小紅書海外用戶數量統計(小紅書從用戶畫像到社區運營怎么做的)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-07-18 01:39:22【】5人已围观
简介er'])['revenue'].describe()#不同性別計數xhs['gender'].value_買粉絲unts(dropna=False).plot
最近30天在APP上參與重要活動與否對應的銷售額是怎樣的
xhs.groupby(['engaged_last_30'])['revenue'].describe()#計數xhs['engaged_last_30'].value_買粉絲unts(dropna=False).plot(kind='bar')#最近30天在APP上參與重要活動與否對應的銷售額平均值sns.barplot(x='engaged_last_30',y='revenue',data=xhs)#最近30天在APP上參與重要活動與否對應的銷售額總和sns.barplot(x='engaged_last_30',y='revenue',data=xhs,estimator=sum)大部分用戶30天內未在APP上參加活動最近30天在APP上參與了活動的用戶的銷售額平均值更大,為320.3,未參加活動的用戶的銷售額平均值為252元。總銷售額的大部分由30天內未在APP上參加活動的用戶創造2.2.4用戶過往在第三方APP購買的數量xhs['3rd_party_stores'].describe()#用戶過往在第三方APP購買的數量計數xhs['3rd_party_stores'].value_買粉絲unts().plot(kind='bar')#用戶過往在第三方APP購買的數量對應的銷售額平均值sns.barplot(x='3rd_party_stores',y='revenue',data=xhs)#用戶過往在第三方APP購買的數量對應的銷售額總和sns.barplot(x='3rd_party_stores',y='revenue',data=xhs,estimator=sum)從未在第三方APP購買過的顧客最多,其次是在第三方APP購買過10次的顧客從未在第三方APP購買過的顧客的平均銷售額最多;在第三方APP進行了1-5次購買的顧客的平均銷售額差不多;在第三方APP進行6-10次購買的顧客的平均銷售額差不多,大于在第三方APP進行了1-5次購買的顧客的平均銷售額。總銷售額大部分由從未在第三方APP購買過的用戶貢獻,其次是在第三方APP購買過10次的用戶,再次是在第三方APP進行了1-5次購買的顧客,貢獻最少的是在第三方APP進行6-10次購買的顧客。三、相關和可視化3.1類別型變量生成啞變量xhs.info()#將gender\lifecycle\engaged_last_30\生成啞變量xhs2=pd.get_mmies(xhs)xhs2.info()3.2計算revenue和其他變量之間的相關性sns.heatmap(xhs2.買粉絲rr(),cmap='YlGnBu')lifecycle_C和days_since_last_order和3rd_party_stores兩兩正相關gender_0.0和engaged_last_30_0.0正相關revenue和其他任何變量之間的相關性都不明顯#僅查看所有變量與revenue的相關性,同時根據相關性做降序排列展示xhs2.買粉絲rr()[['revenue']].sort_values('revenue',ascending=False)revenue和其他任何變量之間的相關性都不明顯和revenue正相關性最高的是days_since_last_order、previous_order_amount、engaged_last_30_1.0和revenue負相關性最高的是3rd_party_stores、engaged_last_30_0.03.3變量可視化分析對于revenue相關性較高的days_since_last_order、previous_order_amount、engaged_last_30_1.0、3rd_party_stores、engaged_last_30_0.0進行相關性可視化分析
#對days_since_last_order變量進行線性關系可視化分析sns.regplot('days_since_last_order','revenue',xhs2,scatter_kws={ 's':3})#對previous_order_amount變量進行線性關系可視化分析sns.regplot('previous_order_amount','revenue',xhs2,scatter_kws={ 's':3})#對engaged_last_30_1.0變量進行線性關系可視化分析sns.regplot('engaged_last_30_1.0','revenue',xhs2,scatter_kws={ 's':0.5})#對3rd_party_stores變量進行線性關系可視化分析sns.regplot('3rd_party_stores','revenue',xhs2,scatter_kws={ 's':3})對于revenue相關性較弱的變量進行相關性可視化分析
#對age變量進行線性關系可視化分析sns.regplot('age','revenue',xhs2,scatter_kws={ 's':3})#對lifecycle_C變量進行線性關系可視化分析sns.regplot('lifecycle_C','revenue',xhs2,scatter_kws={ 's':0.01})四、回歸模型4.1模型建立#調用sklearn中的線性回歸工具包fromsklearn.linear_modelimportLinearRegression#LinearRegression()設置模型為線性回歸model=LinearRegression()#設定自變量和因變量y=xhs2['revenue']x=xhs2[['previous_order_amount','engaged_last_30_1.0','days_since_last_order']]model.fit(x,y)#查看自變量系數model.買粉絲ef_#查看截距model.intercept_4.2模型評估s買粉絲re=model.s買粉絲re(x,y)#x和y打分s買粉絲repredictions=model.predict(x)#計算y預測值error=predictions-y#計算誤差rmse=(error**2).mean()**.5#計算rmsemae=abs(error).mean()#計算maeprint(rmse)print(mae)rmse=260.5mae=205MAE(MeanAbsoluteError)絕對平均誤差,是絕對誤差的平均值把每個數據點的預測值和真實值相見,將所有數據點加總求平均可以更好地反映預測值誤差的實際情況RMSE(RootMeanSquareError)均方根誤差,將每個數據點的誤差取平方后開方RMSE比起MAE放大了誤差,對誤差的懲罰更重常用來作為機器學習模型預測結果衡量的標準#查看標準的模型輸出表fromstatsmodels.formula.apiimportolsmodel=ols('y~x',xhs2).fit()print(model.summary())R-squared僅為0.031Prob為0該回歸基本無意義
4.3模型優化優化思路1:分組后轉換為啞變量將days_since_last_order分組
bins1=[0,12,24]#創建分組labels1=['<12','>=12']xhs2['days_since_last_order_new']=pd.cut(xhs2['days_since_last_order'],bins1,right=False,labels=labels1)xhs2.groupby(['days_since_last_order_new'])['revenue'].describe()days_since_last_order<12和days_since_last_order>=12的銷售額平均值存在明顯區別,分布為245和317
#僅查看所有變量與revenue的相關性,同時根據相關性做降序排列展示xhs2.買粉絲rr()[['revenue']].sort_values('revenue',ascending=False)days_since_last_order_new_>=12和revenue相關性較高,為0.116
將days_since_last_order_new_>=12納入自變量:
#LinearRegression()設置模型為線性回歸model=LinearRegression()#設定自變量和因變量y=xhs2['revenue']x=xhs2[['previous_order_amount','engaged_last_30_1.0','days_since_last_order','days_since_last_order_new_>=12']]model.fit(x,y)s買粉絲re=model.s買粉絲re(x,y)#x和y打分s買粉絲repredictions=model.predict(x)#計算y預測值error=predictions-y#計算誤差rmse=(error**2).mean()**.5#計算rmsemae=abs(error).mean()#計算maeprint(rmse)print(mae)添加了'days_since_last_order_new_>=12'自變量,s買粉絲re:0.030-0.031
將age分組
bins2=很赞哦!(753)
相关文章
- 01 上海樂午貿易有限公司(紐約四季大飯店的相關資料)
- 08 網織紅細胞常用染料(臨床檢驗技師考試《生化檢驗》試題及答案)
- 01 上海買房子條件外地人(外地人在上海買房子需要什么條件)
- 01 上海義振貿易有限公司(求 一個有關技術貿易保護的成功案例)
- 08 網織紅細胞絕對計數96(檢驗技士考試《血液檢驗》模擬題及答案)
- 01 上海五官科醫院買粉絲買粉絲(上海第一人民醫院核酸要求最新上海第一人民醫院核酸要求最新規定)
- 08 蘇州網奇貿易有限公司稅務(關于公司注冊地址變更期限的問題)
- 01 上海丸菱貿易有限公司武漢分公司上班怎么樣(上海丸菱貿易有限公司武漢分公司上班怎么樣)
- 08 網紅打卡地發朋友圈文案折疊(打卡麗江洱海的朋友圈唯美文案通用(50條))
- 01 上海人民廣場怎么去外灘(上海人民廣場到外灘有多遠)
热门文章
站长推荐
01 上海交大中外合作辦學項目碩士學費多少(上海交通大學3+1國際本科學費)
08 耀律國際貿易(上海)有限公司(企業進行海外投資的原因是什么)
01 上海交通大學醫學院附屬仁濟醫院泌尿外科收費(三號線淞發路坐到上海交通大學醫學院附屬仁濟醫院怎么走)
08 美麗大邑買粉絲買粉絲(四川哪些地方可以看到雪?)
08 西湖文化廣場年貨會什么時間(衡東美食指南衡東美食街)
01 上海人稱呼外地人為小弟是什么意思呢(求搞笑相聲臺詞,最好是超搞笑的。笑死人不償命的那種。)
08 網紅打卡地發朋友圈文案折疊(打卡麗江洱海的朋友圈唯美文案通用(50條))
01 上海交通大學中外合作辦學湖南錄取分數線(上海交通大學中外合作錄取分數線2020年)