破了這幾種爬蟲加密算法后，我的路更近了「JS逆向3」偽加密算法：base64信息摘要算法：MD5、SHA對稱加密（加密解密密鑰相同）：DES、3DES、AES非對稱加密（分公鑰私鑰）：RSA自定義加密

發布時間：2023-07-03 10:55:01 作者：網友整理

來源：麥叔編程

作者：kevin。

JS逆向是爬蟲的難點，是爬蟲路上的攔路虎。所謂逆向就是破解網站使用的JS加密算法，拆解相關的參數。然后就可以登堂入室了。

本文總結了JS中最常用的加密算法。正所謂練武不練功，到老一場空。掌握好加密算法就是爬蟲技術的功。如果你是爬蟲是認真的，認真閱讀，收藏，討論。

偽加密算法：base64

Base64是一種用64個字符來表示任意二進制數據的方法。

問：為什么base64被成為偽加密算法？

答：使用base64將明文變成密文的操作最多算是混淆。沒有密鑰注入算法，所以只要拿到密文進行base64解密就能得到對應的明文。

當然還有一種情況就是實現base64的代碼被改寫，成為定制版的base64算法。這也沒關系，把js代碼摳出來再用Python去執行，也能將密文解密。

識別方式：由于base64的編碼的特性，要編碼的二進制數據如果不是3的倍數，最后會剩下1個或2個字節，Base64用x00字節在末尾補足后，再在編碼的末尾加上1個或2個=號，表示補了多少字節。根據這個特性，一般密文結尾處如果是'='結尾的，可以先判斷是base64編碼而成。

信息摘要算法：MD5、SHA

摘要算法又稱哈希算法、散列算法。它通過一個函數，把任意長度的數據轉換為一個長度固定的數據串（通常用16進制的字符串表示）。

信息摘要算法信息摘要位數備注MD5128bit
SHA-1160bit
SHA-224224bitSHA-256的“閹割版”SHA-256256bit
SHA-384384bitSHA-512的“閹割版”SHA-512512bit

摘要算法不能被稱為加密算法，因為它是單向操作明文的。單向操作的意思就是，將明文變成‘密文’之后是無法再將'密文'變成明文（部分信息摘要算法已經被突破，可實現'密'轉明）。

基于這種單向操作的特性，摘要算法一般被用于確保信息傳輸完整一致。在爬蟲模擬登錄部分這種算法用得會比較多，舉個栗子：

假設我現在要將用戶名是kevin，密碼是123在網頁上進行登錄，瀏覽器會先通過js代碼將密碼123轉成202cb962ac59075b964b07152d234b70（MD5）再發送給服務器。服務器收到后，知道這個用戶名為kevin想要登錄，所以從數據庫中調取了kevin對應的密碼123，然后在服務器端也對123進行相應的加密(哈希)也得到202cb962ac59075b964b07152d234b70，校驗兩者一致，服務器就返回給客服端登錄成功的響應。

在實際JS逆向中哈希函數的源碼經常會被改寫，成為定制版哈希函數；還有就是在哈希過程中，明文會被加鹽值，遇到些情況就需要認真分析源碼。

加鹽：上述栗子中，只對密碼進行 md5 加密是肯定不夠的。聰明的程序員想出了個辦法，即使用戶的密碼很短，只要在他的短密碼后面加上一段很長的字符，再計算 md5 ，那反推出原始密碼就變得非常困難了。加上的這段長字符，我們稱為鹽（Salt），通過這種方式加密的結果，我們稱為加鹽 Hash。

import hashlib
md5 = hashlib.md5()
md5.update(b'123I_love_salt') 
#此處的鹽值為 'I_love_salt'
print(md5.hexdigest())

207a9e3b7f1d0c08f5444c8cb92f8d85 #運行結果