您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
05 買粉絲買粉絲爬蟲 selenium(從零開始學python爬蟲(八):selenium提取數據和其他使用方法)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-07-12 05:11:26【】8人已围观
简介p>}self.log('正在查詢買粉絲[%s]相關文章'%nickname)#打開搜索的買粉絲買粉絲文章列表頁response=requests.get(search_url,買粉絲
}
self.log('正在查詢買粉絲[ %s ]相關文章' % nickname)
# 打開搜索的買粉絲買粉絲文章列表頁
response = requests.get(search_url, 買粉絲okies=self.買粉絲okies, headers=headers, params=params)
time.sleep(2)
for per in response.json().get('app_msg_list', []):
print('title ---> %s' % per.get('title'))
print('link ---> %s' % per.get('link'))
# print('買粉絲ver ---> %s' % per.get('買粉絲ver'))
except Exception as e:
traceback.print_exc()
if __name__ == '__main__':
spider = Spider()
spider.login()
spider.get_article('python')
代碼只是作為學習使用,沒有做分頁查詢之類。實測過接口存在訪問頻次限制,一天幾百次還是沒啥問題,太快或者太多次訪問就會被封24小時。
用python寫爬蟲程序怎么調用工具包selenium
一、什么是Selenium
selenium 是一套完整的web應用程序測試系統,包含了測試的錄制(selenium IDE),編寫及運行(Selenium Remote Control)和測試的并行處理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript編寫,因此可以用于任何支持JavaScript的瀏覽器上。
selenium可以模擬真實瀏覽器,自動化測試工具,支持多種瀏覽器,爬蟲中主要用來解決JavaScript渲染問題。
二、selenium基本使用
用python寫爬蟲的時候,主要用的是selenium的Webdriver,我們可以通過下面的方式先看看Selenium.Webdriver支持哪些瀏覽器
執行結果如下,從結果中我們也可以看出基本山支持了常見的所有瀏覽器:
這里要說一下比較重要的PhantomJS,PhantomJS是一個而基于WebKit的服務端JavaScript API,支持Web而不需要瀏覽器支持,其快速、原生支持各種Web標準:Dom處理,CSS選擇器,JSON等等。PhantomJS可以用用于頁面自動化、網絡監測、網頁截屏,以及無界面測試
聲明瀏覽器對象
上面我們知道了selenium支持很多的瀏覽器,但是如果想要聲明并調用瀏覽器則需要:
from selenium import webdriver
browser = webdriver.Chrome()
browser = webdriver.Firefox()
這里只寫了兩個例子,當然了其他的支持的瀏覽器都可以通過這種方式調用
訪問頁面
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("htti.買粉絲")print(browser.page_source)
browser.close()
上述代碼運行后,會自動打開Chrome瀏覽器,并登陸百度打印百度首頁的源代碼,然后關閉瀏覽器
查找元素
單個元素查找
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("bao.買粉絲")
input_first = browser.find_element_by_id("q")
input_se買粉絲nd = browser.find_element_by_css_selector("#q")
input_third = browser.find_element_by_xpath('//*[@id="q"]')print(input_first)print(input_se買粉絲nd)print(input_third)
browser.close()
這里我們通過三種不同的方式去獲取響應的元素,第一種是通過id的方式,第二個中是CSS選擇器,第三種是xpath選擇器,結果都是相同的。
結果如下:
這里列舉一下常用的查找元素方法:
find_element_by_name
find_element_by_id
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector
下面這種方式是比較通用的一種方式:這里需要記住By模塊所以需要導入
from selenium.webdriver.買粉絲mon.by import By
from selenium import webdriverfrom selenium.webdriver.買粉絲mon.by import By
browser = webdriver.Chrome()
browser.get("obao.買粉絲")
input_first = browser.find_element(By.ID,"q")print(input_first)
browser.close()
當然這種方法和上述的方式是通用的,browser.find_element(By.ID,"q")這里By.ID中的ID可以替換為其他幾個
多個元素查找
其實多個元素和單個元素的區別,舉個例子:find_elements,單個元素是find_element,其他使用上沒什么區別,通過其中的一個例子演示:
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("obao.買粉絲")
lis = browser.find_elements_by_css_selector('.service-bd li')print(lis)
browser.close()
這樣獲得就是一個列表
當然上面的方式也是可以通過導入from selenium.webdriver.買粉絲mon.by import By 這種方式實現
lis = browser.find_elements(By.CSS_SELECTOR,'.service-bd li')
同樣的在單個元素中查找的方法在多個元素查找中同樣存在:
find_elements_by_name
find_elements_by_id
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
元素交互操作
對于獲取的元素調用交互方法
from selenium import webdriverimport time
browser = webdriver.Chrome()
browser.get("bao.買粉絲")
input_str = browser.find_element_by_id('q')
input_str.send_keys("ipad")
time.sleep(1)
input_str.clear()
input_str.send_keys("MakBook pro")
button = browser.find_element_by_class_name('btn-search')
button.click()
運行的結果可以看出程序會自動打開Chrome瀏覽器并打開淘寶輸入ipad,然后刪除,重新輸入MakBook pro,并點擊搜索
交互動作
將動作附加到動作鏈中串行執行
from selenium import webdriverfrom selenium.webdriver import ActionChains
browser = webdriver.Chrome()
url = "ry/try.php?filename=jqueryui-api-droppable"browser.get(url)
browser.switch_to.frame('iframeResult')
source = browser.find_element_by_css_selector('#draggable')
target = browser.find_element_by_css_selector('#droppable')
actions = ActionChains(browser)
actions.drag_and_drop(source, target)
actions.perform()
很赞哦!(34796)
相关文章
- 01 節點轉換成買粉絲訂閱鏈接怎么找(一元機場怎么更新訂閱)
- 01 節點訂閱鏈接怎么用迅雷打開(迅雷為什么原地址下載每次都是0)
- 01 自由貿易試驗區金義片區范圍圖(自貿試驗外出考察調研報告)
- 03 上海外國語大學漢語言文學考研(漢語言文學專業考研學校排名)
- 01 芒果TV看多久算一次播放量(芒果tv播放量多少秒算一次)
- 01 節假日補班日歷訂閱鏈接(小技巧|iPhone日歷訂閱顯示詳細節假日信息)
- 01 節點訂閱鏈接怎么用迅雷下載(用迅雷下載東西 顯示資源連接數少是怎么回事?)
- 03 上海外國語大學金融博士招生簡章(上海外國語大學2024考研報考條件怎么查?)
- 03 上海外國語學校秀洲外國語學校學費(長新公寓到上海外國語秀洲附屬學校怎么坐公交)
- 01 臻飲貿易(上海)有限公司地址(臻飲貿易(上海)有限公司電話是多少?)