您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
02 youtube music 買粉絲s youtube music 買粉絲(今日新聞淺談:Youtube Music 也加入串流音樂服務大混戰)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-07-27 02:30:03【】1人已围观
简介aticspamprotectionandotherfeatures.4.5星級用戶統計搜索分析今日新聞淺談:YoutubeMusic也加入串流音樂服務大混戰youtubeMusic在這幾天正式上線,
用戶統計 搜索分析
今日新聞淺談:Youtube Music 也加入串流音樂服務大混戰
youtube Music 在這幾天正式上線,雖然相較其他音樂服務真的晚很多,但是卻不會是一個阻礙 Youtube 發展的絆腳石,除了已經有非常強大的音樂資料庫之外,用戶的數量也早就不是其他平臺可以較勁的,而且還有像是 Live 版、惡搞版和混音版各式各樣的版本可以收聽,光想就覺得這個對手根本有課金!(最近手游玩很多...) Youtube Music 也不意外的會在音樂轉場期間播放廣告,要用付費的方式才能移除這些穿插廣告,而且付費后就可以離線收聽、背景播放;其實到現在看過比較過 Apple Music、Spotify(在臺灣則是 KKBOX 為龍頭)這些串流音樂服務之后,能提供的服務落差著實不大,完全看使用者喜歡什么類型的音樂,哪一間能提供最多該類型的音樂以及適合的價格,在這場和平之爭中用戶也許可以成為漁翁。 -- 一張圖就能看到今天最重要新聞,這么好康,不按贊嗎? 請幫討喜小姐按贊:facebook/miluson.lu --看更多攪豬屎練肖話的 今日新聞淺談 傳送門 討喜小姐粉絲團
推薦給癮科科的線上學習課程|開箱文工作坊 - 如何寫開箱文行銷你的 App
你或許會喜歡
超低價主流款LED(想戀愛者必看!)
家電全面下殺四天 有買有保佑
4G上網只要299!遠傳推出業界最低4G上網方案
Hive實戰之Youtube數據集
本次實戰的數據來自于"YouTube視頻統計與社交網絡"的數據集,是西蒙弗雷澤大學計算機學院在2008年所爬取的數據
數據集地址
數據之間采用"\t"作為分隔符
具體數據如下:
數據量大小為1G,條數為500萬+
使用環境為
hive-1.1.0-cdh5.4.5
hadoop-2.6.0-cdh5.4.5
演示形式為使用hive shell
我們一起來看看數據
主要的問題在于category和relatedIDs處理,由于Hive是支持array格式的,所以我們想到的是使用array來存儲category和relatedIDs,但是我們發現category的分割符是"&"而realatedIDs的分隔符是"\t",我們在創建表格的時候能夠指定array的分隔符,但是只能指定一個,所以再將數據導入到Hive表格之前我們需要對數據進行一定轉換和清洗
并且數據中肯定會存在一些不完整數據和一些奇怪的格式,所以數據的清洗是必要的,我在這里所使用的數據清洗方式是使用Spark進行清洗,也可以使用自定義UDF函數來進行清洗
數據清洗注意點
1)我們可以看到每行數據以"\t"作為分隔符,每行有十列數據,最后一列關聯ID可以為空,那么我們對數據進行split之后數組的大小要大于8
2)數據中存在 "uNiKXDA8eyQ KRQE 1035 News & Politics 107" 這樣格式的數據,所以在處理category時需要注意 News & Politics中間的 &
處理后的數據如下:
下面的實戰都是基于數據清洗后的數據進行的
1)youtube1的創建,文件格式為textfile
create table youtube1(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as textfile;
2)youtube2的創建,文件格式為orc
create table youtube2(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as orc;
3)youtube3的創建,文件格式為orc,進行桶分區
create table youtube3(買粉絲Id string, uploader string, age int, category array<string>, length int, views int, rate float, ratings int, 買粉絲ments int,relatedId array<string>)
clustered by (uploader) into 8 buckets
row format delimited
fields terminated by "\t"
買粉絲llection items terminated by "&"
stored as orc;
數據導入:
1)load data inpath "path" into table youtube1;
2)由于無法將textfile格式的數據導入到orc格式的表格,所以數據需要從youtube1導入到youtube2和youtube3:
insert into table youtube2 select * from youtube1;
insert into table youtube3 select * from youtube1;
1)user_tmp的創建,文件格式textfile,24buckets
create table user_tmp(uploader string,買粉絲s int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as textfile;
2)user的創建,文件格式orc,24buckets
create table user(uploader string,買粉絲s int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as orc;
user表的數據導入也是同理
數據導入:
1)load data inpath "path" into table user_tmp;
2)由于無法將textfile格式的數據導入到orc格式的表格,所以數據需要從user_tmp導入到user:
insert into table user select * from user_tmp;
1)統計出觀看數最多的10個視頻
2)統計出視頻類別熱度的前10個類型
3)統計出視頻觀看數最高的50個視頻的所屬類別
4)統計出觀看數最多的前N個視頻所關聯的視頻的所屬類別排行
5)篩選出每個類別中熱度最高的前10個視頻
6)篩選出每個類別中評分最高的前10個視頻
7)找出用戶中上傳視頻最多的10個用戶的所有視頻
8)篩選出每個類別中觀看數Top10
select * from youtube3 order by views desc limit 10;
結果如下:
select tagId, 買粉絲unt(a.買粉絲id) as sum from (select 買粉絲id,tagId from youtube3 lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc limit 10;
結果:
select tagId, 買粉絲unt(a.買粉絲id) as sum from (select 買粉絲id,tagId from (select * from youtube3 order by views desc limit 20) e lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc;
結果:
思路:
結果:
思路:
結果如下:
select * from youtube_category where categoryId="Music" order by ratings desc limit 10;
結果如下:
思路:
結果如下:
一個國外的十多歲的男孩吧!唱過一首歌叫《Baby》.我想知道他的個人資料
他叫Justin Bieber
以下是百度百科的資料
個人檔案 中文名:賈斯汀·比伯
原名:Justin Drew Bi
很赞哦!(798)
相关文章
- google store apps youtube(youtube登錄不了google賬戶)
- 02 youtube download for ios官網下載(怎樣才能學好python語言?)
- 02 youtube classic 買粉絲untry music 60s 70s(音樂種類英文介紹及中文翻譯)
- how do i clear youtube cached翻譯(youtube自動翻譯成中文)
- google chrome youtube search(手機的GMS是什么意思?謝謝?)
- greatest hits of celine dion youtube視頻下載(10首英文歌要歌詞,出處.作者,(越短越好))
- 02 youtube dl不能使用(亞運會LOL為什么不能看)
- 02 youtube app for ios(Youtube iOS客戶端視頻播放錯誤。)
- install free youtube downloader for pc(為什么我用Youtube Downloader HD 最新版的軟件 去下載Youtube 上的視頻 我把地址復制上去后)
- https www youtube com c dream(肖邦音樂分析和四首樂曲鑒賞)
热门文章
站长推荐
instagram可以用Facebook登陸嗎(為什么大陸明星大部分都可以用Facebook、Instagram…之類中國大陸禁用的app?)
02 youtube edit playlist name(好聽的英文歌)
02 youtube app for windows 11 home(iOS的內置應用)
02 youtube app for microsoft 10(用什么工具可以把正在放的視頻下到本地?)
02 youtube dl不能使用(亞運會LOL為什么不能看)
02 youtube dl不能用了是什么(在Ubuntu上有什么必裝的實用軟件?)
02 youtube app for windows phone(蘋果怎么下soundcloud)
how to download youtube music without premium(如何在youtubemusic中創建快捷指令)