您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
02 facebook好友排序規則(推薦算法簡介)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-07-23 04:15:09【】8人已围观
简介進行更新。具體來說,我們將所有標簽按照重要程度由高到低進行排序,選擇前p個標簽作為我們的標簽集合。給定一首歌曲t,我們用一個超高維向量Xt=(Xt1,…,Xtp)∈?p表示它的標簽信息,其中Xtj=1
對于歌單、電臺這些由歌曲集合而成的實體,我們也可以通過標簽的方式對其進行刻畫。例如,對于給定的一個歌單m,我們同樣用一個超高維向量
百度是誰創立的
百度是李彥宏創立的。
1991年,李彥宏畢業于北京大學信息管理專業,隨后前往美國布法羅紐約州立大學完成計算機科學碩士學位,先后擔任道·瓊斯公司高級顧問,《華爾街日報》網絡版實時金融信息系統設計者,Infoseek公司資深工程師。
2000年1月,李彥宏創建百度。并持有“超鏈分析”技術專利。2013年,當選第十二屆全國政協委員,兼任中國民間商會副會長,第十一屆中華全國工商業聯合會副主席、第八屆北京市科協副主席等職務,并獲聘“國家特聘專家”。
2018年1月19日,李彥宏成為了《時代》當期亞洲版的封面人物。2018年12月18日,黨中央、國務院授予李彥宏改革先鋒稱號,頒授改革先鋒獎章。
推薦算法簡介
寫在最前面:本文內容主要來自于書籍《推薦系統實踐》和《推薦系統與深度學習》。
推薦系統是目前互聯網世界最常見的智能產品形式。從電子商務、音樂視頻網站,到作為互聯網經濟支柱的在線廣告和新穎的在線應用推薦,到處都有推薦系統的身影。推薦算法是推薦系統的核心,其本質是通過一定的方式將用戶和物品聯系起來,而不同的推薦系統利用了不同的方式。
推薦系統的主要功能是以個性化的方式幫助用戶從極大的搜索空間中快速找到感興趣的對象。因此,目前所用的推薦系統多為個性化推薦系統。個性化推薦的成功應用需要兩個條件:
在推薦系統的眾多算法中,基于協同的推薦和基于內容的推薦在實踐中得到了最廣泛的應用。本文也將從這兩種算法開始,結合時間、地點上下文環境以及社交環境,對常見的推薦算法做一個簡單的介紹。
基于內容的算法的本質是對物品內容進行分析,從中提取特征,然后基于用戶對何種特征感興趣來推薦含有用戶感興趣特征的物品。因此,基于內容的推薦算法有兩個最基本的要求:
下面我們以一個簡單的電影推薦來介紹基于內容的推薦算法。
現在有兩個用戶A、B和他們看過的電影以及打分情況如下:
其中問好(?)表示用戶未看過。用戶A對《銀河護衛隊 》《變形金剛》《星際迷航》三部科幻電影都有評分,平均分為 4 .7 分 ( (5+4+5 ) / 3=4.7 );對《三生三世》《美人魚》《北京遇上西雅圖》三部愛情電影評分平均分為 2.3 分 ( ( 3十2+2 ) /3=2.3 )。現在需要給A推薦電影,很明顯A更傾向于科幻電影,因此推薦系統會給A推薦獨立日。而對于用戶B,通過簡單的計算我們可以知道更喜歡愛情電影,因此給其推薦《三生三世》。當然,在實際推薦系統中,預測打分比這更加復雜些,但是其原理是一樣的。
現在,我們可以將基于內容的推薦歸納為以下四個步驟:
通過上面四步就能快速構建一個簡單的推薦系統。基于內容的推薦系統通常簡單有效,可解釋性好,沒有物品冷啟動問題。但他也有兩個明顯的缺點:
最后,順便提一下特征提取方法:對于某些特征較為明確的物品,一般可以直接對其打標簽,如電影類別。而對于文本類別的特征,則主要是其主題情感等,則些可以通過tf-idf或LDA等方法得到。
基于協同的算法在很多地方也叫基于鄰域的算法,主要可分為兩種:基于用戶的協同算法和基于物品的協同算法。
啤酒和尿布的故事在數據挖掘領域十分有名,該故事講述了美國沃爾瑪超市統計發現啤酒和尿布一起被購買的次數非常多,因此將啤酒和尿布擺在了一起,最后啤酒和尿布的銷量雙雙增加了。這便是一個典型的物品協同過濾的例子。
基于物品的協同過濾指基于物品的行為相似度(如啤酒尿布被同時購買)來進行物品推薦。該算法認為,物品A和物品B具有很大相似度是因為喜歡物品A的用戶大都也喜歡物品B。
基于物品的協同過濾算法主要分為兩步:
基于物品的協同過濾算法中計算物品相似度的方法有以下幾種:
(1)基于共同喜歡物品的用戶列表計算。
此外,John S. Breese再其論文中還提及了IUF(Inverse User Frequence,逆用戶活躍度)的參數,其認為活躍用戶對物品相似度的貢獻應該小于不活躍的用戶,應該增加IUF參數來修正物品相似度的公式:
上面的公式只是對活躍用戶做了一種軟性的懲罰, 但對于很多過于活躍的用戶, 比如某位買了當當網80%圖書的用戶, 為了避免相似度矩陣過于稠密, 我們在實際計算中一般直接忽略他的興趣列表, 而不將其納入到相似度計算的數據集中。
(2)基于余弦相似度計算。
(3)熱門物品的懲罰。
此外,Kary pis在研究中發現如果將ItemCF的相似度矩陣按最大值歸一化, 可以提高推薦的準確率。 其研究表明, 如果已經得到了物品相似度矩陣w, 那么可以用如下公式得到歸一化之后的相似度矩陣w':
歸一化的好處不僅僅在于增加推薦的準確度,它還可以提高推薦的覆蓋率和多樣性。一般來說,物品總是屬于很多不同的類,每一類中的物品聯系比較緊密。假設物品分為兩類——A和B, A類物品之間的相似度為0.5, B類物品之間的相似度為0.6, 而A類物品和B類物品之間的相似度是0.2。 在這種情況下, 如果一個用戶喜歡了5個A類物品和5個B類物品, 用ItemCF給他進行推薦, 推薦的就都是B類物品, 因為B類物品之間的相似度大。 但如果歸一化之后, A類物品之間的相似度變成了1, B類物品之間的相似度也是1, 那么這種情況下, 用戶如果喜歡5個A類物品和5個B類物品, 那么他的推薦列表中A類物品和B類物品的數目也應該是大致相等的。 從這個例子可以看出, 相似度的歸一化可以提高推薦的多樣性。
那么,對于兩個不同的類,什么樣的類其類內物品之間的相似度高,什么樣的類其類內物品相似度低呢?一般來說,熱門的類其類內物品相似度一般比較大。如果不進行歸一化,就會推薦比較熱門的類里面的物品,而這些物品也是比較熱門的。因此,推薦的覆蓋率就比較低。相反,如果進行相似度的歸一化,則可以提高推薦系統的覆蓋率。
最后,利用物品相似度矩陣和用戶打過分的物品記錄就可以對一個用戶進行推薦評分:
基于用戶的協同算法與基于物品的協同算法原理類似,只不過基于物品的協同是用戶U購買了A物品,會計算經常有哪些物品與A一起購買(也即相似度),然后推薦給用戶U這些與A相似的物品。而基于用戶的協同則是先計算用戶的相似性(通過計算這些用戶購買過的相同的物品),然后將這些相似用戶購買過的物品推薦給用戶U。
基于用戶的協同過濾算法主要包括兩個步驟:
步驟(1)的關鍵是計算用戶的興趣相似度,主要是利用用戶的行為相似度計算用戶相似度。給定用戶 u 和 v,N(u) 表示用戶u曾經有過正反饋(譬如購買)的物品集合,N(v) 表示用戶 v 曾經有過正反饋的物品集合。那么我們可以通過如下的 Jaccard 公式簡單的計算 u 和 v 的相似度:
或通過余弦相似度:
得到用戶之間的相似度之后,UserCF算法會給用戶推薦和他興趣最相似的K個用戶喜歡的物品。如下的公式度量了UserCF算法中用戶 u 對物品 i 的感興趣程度:
首先回顧一下UserCF算法和ItemCF算法的推薦原理:UserCF給用戶推薦那些和他有共同興趣愛好的用戶喜歡的物品, 而ItemCF給用戶推薦那些和他之前喜歡的物品具有類似行為的物品。
(1)從推薦場景考慮
首先從場景來看,如果用戶數量遠遠超過物品數量,如購物網站淘寶,那么可以考慮ItemCF,因為維護一個非常大的用戶關系網是不容易的。其次,物品數據一般較為穩定,因此物品相似度矩陣不必頻繁更新,維護代價較小。
UserCF的推薦結果著重于反應和用戶興趣相似的小群體的熱點,而ItemCF的推薦結果著重于維系用戶的歷史興趣。換句話說,UserCF的推薦更社會化,反應了用戶所在小型興趣群體中物品的熱門程度,而ItemCF的推薦更加個性化,反應了用戶自己的個性傳承。因此UserCF更適合新聞、微博或微內容的推薦,而且新聞內容更新頻率非常高,想要維護這樣一個非常大而且更新頻繁的表無疑是非常難的。
在新聞類網站中,用戶的興趣愛好往往比較粗粒度,很少會有用戶說只看某個話題的新聞,而且往往某個話題也不是每天都會有新聞。 個性化新聞推薦更強調新聞熱點,熱門程度和時效性是個性化新聞推薦的重點,個性化是補充,所以 UserCF 給用戶推薦和他有相同興趣愛好的人關注的新聞,這樣在保證了熱點和時效性的同時,兼顧了個性化。
(2)從系統多樣性(也稱覆蓋率,指一個推薦系統能否給用戶提供多種選擇)方面來看,ItemCF的多樣性要遠遠好于UserCF,因為UserCF更傾向于推薦熱門物品。而ItemCF具有較好的新穎性,能夠發現長尾物品。所以大多數情況下,ItemCF在精度上較小于UserCF,但其在覆蓋率和新穎性上面卻比UserCF要好很多。
在介紹本節基于矩陣分解的隱語義模型之前,讓我們先來回顧一下傳統的矩陣分解方法SVD在推薦系統的應用吧。
基于SVD矩陣分解在推薦中的應用可分為如下幾步:
SVD在計算前會先把評分矩陣 A 缺失值補全,補全之后稀疏矩陣 A 表示成稠密矩陣,然后將分解成 A' = U∑V T 。但是這種方法有兩個缺點:(1)補成稠密矩陣后需要耗費巨大的儲存空間,對這樣巨大的稠密矩陣進行儲存是不現實的;(2)SVD的計算復雜度很高,對這樣大的稠密矩陣中進行計算式不現實的。因此,隱語義模型就被發明了出來。
更詳細的SVD在推薦系統的應用可參考 奇異值分解SVD簡介及其在推薦系統中的簡單應用 。
隱語義模型(Latent Factor Model)最早在文本挖掘領域被提出,用于找到文本的隱含語義。相關的算法有LSI,pLSA,LDA和Topic Model。本節將對隱語義模型在Top-N推薦中的應用進行詳細介紹,并通過實際的數據評測該模型。
隱語義模型的核心思想是通過隱含特征聯系用戶興趣和物品。讓我們通過一個例子來理解一下這個模型。
現有兩個用戶,用戶A的興趣涉及偵探小說、科普圖書以及一些計算機技術書,而用戶B的興趣比較集中在數學和機器學習方面。那么如何給A和B推薦圖書呢?
我們可以對書和物品的興趣進行分類。對于某個用戶,首先得到他的興趣分類,然后從分類中挑選他可能喜歡的物品。簡言之,這個基于興趣分類的方法大概需要解決3個問題:
對于
很赞哦!(1452)
相关文章
- 01 lofter怎么看訂閱的合集(《lofter》訂閱合集查看方法)
- 03 買粉絲 music 買粉絲s youtube 1980s songs(求希斯萊杰的英文介紹)
- 03 買粉絲 music 買粉絲s youtube 1980s songs(求希斯萊杰的英文介紹)
- 03 買粉絲 youtube to mp3 downloader app 買粉絲(C#的側邊欄技術。答好了加分。)
- 01 lofter怎么看標簽訂閱量(lofter的瀏覽量是怎么計算的)
- 01 lofter作者能看到訂閱的人嗎(lofter訂閱合集作者知道嗎)
- 01 ldp和ddp貿易術語(請教外貿術語中LDP與DDP的英文全稱是什么,兩者有何區別)
- 03 Hawkins是什么意思(Hawkins英語怎么讀,解釋一什么意思,)
- 03 inspire用法及短語(handle的用法和短語例句)
- 01 lofter訂閱合集上限(lofter合集訂閱已滿怎么辦)
热门文章
站长推荐
01 keep doing sth造句簡單帶翻譯(用why造句帶回答翻譯3個句子)
01 LED顯示屏外貿哪個平臺好做點(金融危機對溫州鎖業的影響)
03 how download youtube app on iphone(防彈少年團《ON》Youtube點擊數突破5億,這個團隊的人氣高嗎?)
01 linux youtube download 買粉絲(手機錄像相機軟件哪個好)
03 finish your cake什么意思(幫忙英文翻譯 小短句 謝謝)
01 lisains粉絲數量排名破千萬(lisains粉絲數量2021)
01 lofter怎么刪除訂閱的標簽(lofter屏蔽標簽有什么用)
03 how to get cc on youtube(來推薦點好聽的Rap吧`)