網站首頁 編程語言 正文
1.安裝
完成自動化測試,需要配置三個東西。
selenium
:pip就可以了
chrome
:瀏覽器下載一個谷歌瀏覽器就行
chrome-driver
:下載地址http://chromedriver.storage.googleapis.com/index.html
這里需要對應到自己的瀏覽器版本下載。可以參考這篇
https://www.jb51.net/article/240643.htm
從瀏覽器上下載到本地后,本機mac上自動保存至Download/目錄下
但我們要把它轉移到該去的地方
具體終端命令如下:
#目錄到下載位置 cd Downloads/ #解壓zip文件 unzip chromedriver_mac64.zip #拿到解壓后文件Unix Executable類型文件后,移動它該去的位置 mv chromedriver /usr/local/bin/
2.基礎操作
下面就來了解一下 Selenium 的一些基礎操作把。先寫一點簡單的小功能演示一下:
from selenium import webdriver from selenium.webdriver.common.keys import Keys browser = webdriver.Chrome() browser.get('https://www.baidu.com') input = browser.find_element_by_id('kw') input.send_keys('楊冪') input.send_keys(Keys.ENTER) print(browser.current_url) print(browser.get_cookies()) print(browser.page_source)
運行以上代碼,可以看到自動彈出來一個 Chrome 瀏覽器,并且上面標示了: Chrome 正受到自動軟件的控制 。然后打開了百度,在輸入框中輸入了 “楊冪” 進行搜索
2.1 聲明瀏覽器對象
Selenium 支持非常多的瀏覽器,如:
from selenium import webdriver # 聲明瀏覽器對象,需對應的驅動程序方可使用 browser = webdriver.android() browser = webdriver.blackberry() browser = webdriver.chrome() browser = webdriver.edge() browser = webdriver.firefox() browser = webdriver.ie() browser = webdriver.opera() browser = webdriver.phantomjs() browser = webdriver.safari()
可以看到有我熟悉的 IE 瀏覽器、 Edge 瀏覽器、 FireFox 瀏覽器、 Opera 瀏覽器等等。
2.2 訪問網頁
訪問網頁可以使用 get() 方法,參數傳入我們想要訪問的網站即可:
from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.jd.com/') print(browser.page_source)
通過上面兩行代碼,我們可以看到自動打開了瀏覽器并訪問的京東,在控制臺打印了京東的源代碼。
當然,如果想要程序自動關閉瀏覽器的話可以使用:
browser.close()
2.3 查找單個節點
我們獲取到網頁后,第一步肯定是要先查找到 DOM 節點啊,然后可以直接從 DOM 節點中獲取數據。
不過有了 Selenium 以后,我們不僅可以查找到節點獲取數據,還可以模擬用戶操作,比如在搜索框輸入某些內容,點擊按鈕等等操作,不過還是先看看怎么查找節點:
從上面這張圖可以看到,我們想要獲取輸入框,可以通過 id 進行獲取,那么我們接下來的代碼要這么寫:
from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.jd.com/') input_key = browser.find_element_by_id('key') print(input_key)
結果如下:
可以看到,我們獲得的元素類型是 WebElement 。
這里順手列出所有的獲得單個節點的方法:
find_element_by_id find_element_by_name find_element_by_xpath find_element_by_link_text find_element_by_partial_link_text find_element_by_tag_name find_element_by_class_name find_element_by_css_selector
此外, selenium 還未我們提供了一個通用方法 find_element() ,它需要傳入兩個參數:查找方式 By 和值。實際上上面示例中的查找方式還可以這么寫(效果完全一樣哦~~~)
from selenium import webdriver from selenium.webdriver.common.by import By browser = webdriver.Chrome() browser.get('https://www.jd.com/') input_key1 = browser.find_element(By.ID, 'key') print(input_key1)
2.4 查找多個節點
比如我們要查找左邊的這種導航條的所有條目:
可以這么寫
lis = browser.find_elements_by_css_selector('.cate_menu li') print(lis)
結果如下:
[
, ,?
......]
下面列出來所有的多節點選擇的方法:
find_elements_by_name find_elements_by_xpath find_elements_by_link_text find_elements_by_partial_link_text find_elements_by_tag_name find_elements_by_class_name find_elements_by_css_selector
同樣,多節點選擇也有一個 find_elements() 的方法,
3.等待
如今,大多數 Web 應用程序都在使用 AJAX 技術。當瀏覽器加載頁面時,該頁面中的元素可能會以不同的時間間隔加載。這使定位元素變得困難:如果 DOM 中尚不存在元素,則定位函數將引發 ElementNotVisibleException 異常。使用等待,我們可以解決此問題。等待在執行的動作之間提供了一定的松弛時間-主要是定位元素或對該元素進行的任何其他操作。
Selenium Webdriver 提供兩種類型的等待-隱式和顯式。顯式等待使 WebDriver 等待特定條件發生,然后再繼續執行。隱式等待使 WebDriver 在嘗試查找元素時輪詢DOM一定時間。
3.1 顯式等待
我們可以使用 time.sleep() 來設定等待時間,完全沒有問題,但是它需要將條件設置為要等待的確切時間段。如果我們不知道準確的渲染時間,我們就無法設定一個比較合適的值。
Selenium 為我們提供了 WebDriverWait 與 ExpectedCondition 來完成這件事情,看代碼:
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome() driver.get("https://www.jd.com/") try: element = WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, "key")) ) finally: driver.quit()
結果如下:
上面我們使用了 WebDriverWait 來設置最長等待時間,這里我們選擇獲取 JD 首頁的輸入框,我們限定的等待時間為 10s ,如果它在 10s 內都無法返回結果,將會拋出 TimeoutException 。默認情況下, WebDriverWait 每 500 毫秒調用 ExpectedCondition ,直到成功返回。
3.2 隱式等待
隱式等待告訴 WebDriver 在嘗試查找不立即可用的一個或多個元素時在一定時間內輪詢 DOM 。默認設置為 0 。設置后,將在 WebDriver 對象的生存期內設置隱式等待。
from selenium import webdriver driver = webdriver.Chrome() driver.implicitly_wait(10) # seconds driver.get("https://www.jd.com/") key = driver.find_element_by_id("key") print(key)
節點交互
Selenium 為我們提供了一些節點的交互動作,如輸入文字時可以用 send_keys() 方法,清空文字時可以用 clear() 方法,點擊按鈕時可以用 click() 方法。
from selenium import webdriver import time driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get('https://www.taobao.com/') input = driver.find_element_by_id('q') input.send_keys('IPad') time.sleep(1) input.clear() input.send_keys('Surface Pro') button = driver.find_element_by_class_name('btn-search') button.click()
在上面這個示例中,我們先打開淘寶網,并且開啟了隱式等待,先在搜索框中輸入了 IPad ,在等待 1s 后刪除,再輸入了 Surface Pro ,然后點擊了搜索按鈕,先在淘寶搜索需要用戶登錄才能搜索,所以我們直接跳轉到了登錄頁。
執行 JavaScript
對于某些 Selenium API 沒有提供的操作,我們可以通過模擬運行 JavaScript 的方式來完成,用到的方法是 execute_script() ,比如我們在淘寶首頁將滾動條滑到底部:
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.taobao.com/') driver.execute_script('window.scrollTo(0, document.body.scrollHeight)')
獲取信息
前面我們介紹了如何拿到 DOM 節點,那么最重要的是我們要從 DOM 節點上來獲取我們需要的信息。
因為我們獲取的是 WebElement 類型,而 WebElement 也提供了相關的方法來提取節點信息。
from selenium import webdriver from selenium.webdriver.chrome.options import Options # 實例化一個啟動參數對象 chrome_options = Options() # 設置瀏覽器窗口大小 chrome_options.add_argument('--window-size=1366, 768') # 啟動瀏覽器 driver = webdriver.Chrome(chrome_options=chrome_options) url = 'https://www.geekdigging.com/' driver.get(url) title = driver.find_element_by_xpath('//*[@id="text-4"]/div/div/div[1]/div[2]/a') print(title) # 獲取屬性信息 print(title.get_attribute('href')) # 獲取文本信息 print(title.text) # 獲取位置 print(title.location) # 獲取大小 print(title.size)
上面因為 Chrome 默認打開大小有點小,打開小編博客的時候小編選擇的這個 DOM 節點正好看到,所以小編設置了一下 Chrome 瀏覽器打開時的大小。
具體信息的供大家參考:
- parent:查找到此元素的WebDriver實例的內部引用。
- rect:具有元素大小和位置的字典。
- screenshot_as_base64:以 base64 編碼字符串的形式獲取當前元素的屏幕快照。
- screenshot_as_png:以二進制數據獲取當前元素的屏幕截圖。最后這兩個獲取元素屏幕快照,在獲取驗證碼的時候將驗證碼截取出來會很好用的。
前進和后退
我們使用瀏覽器最上面的地方有一個前進和后退按鈕,Selenium 完成這兩個動作使用了 back() 和 forward() 這兩個方法。
import time from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.jd.com/') browser.get('https://www.taobao.com/') browser.get('https://www.geekdigging.com/') browser.back() time.sleep(1) browser.forward()
Cookies
又到了一個重點內容, Cookies ,它是和服務端保持會話的一個重要元素。 Selenium 為我們提供了一些方法,讓我們可以方便的對 Cookies 進行增刪改查等操作。示例如下:
from selenium import webdriver browser = webdriver.Chrome() browser.get('https://www.geekdigging.com/') # 獲取 cookies print(browser.get_cookies()) # 添加一個 cookie browser.add_cookie({'name': 'name', 'domain': 'www.geekdigging.com', 'value': 'geekdigging'}) print(browser.get_cookies()) # 刪除所有 cookie browser.delete_all_cookies() print(browser.get_cookies())
總結
原文鏈接:https://blog.csdn.net/weixin_42010722/article/details/123424765
相關推薦
- 2022-06-18 C語言?詳解字符串基礎_C 語言
- 2022-04-03 在Python中如何優雅地創建表格的實現_python
- 2022-12-09 C++實現雙向起泡排序算法_C 語言
- 2022-08-30 ST-Link設備連接。 Could not verify ST device! Abort con
- 2024-01-27 Linux關于Centos IP靜態配置
- 2022-11-09 Android?使用maven?publish插件發布產物(aar)流程實踐_Android
- 2022-11-05 Python入門教程之運算符重載詳解_python
- 2022-01-07 event的srcelement和target
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支