import requests,time import random from bs4 import BeautifulSoup import re import threading def ports(hostm,port): url = 'http://tool.chinaz.com/port/' headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36' } data = { 'host':hostm, 'port':port } response = requests.post(url,headers=headers,data=data).text encode = BeautifulSoup(response,'html.parser').findAll('input',{"id":"encode"})[0].get('value') data['encode'] = encode callback = "jQuery113"+str(int(random.random()*100000000000000000))+'_'+str(int(time.time()*1000)) params = { 'callback':callback, 't':'port' } url = 'http://tool.chinaz.com/iframe.ashx' response = requests.post(url,headers=headers,data=data,params=params).text response = re.sub(callback,'',response) print(re.findall(r"'(.*?)'",response)[0]) return re.findall(r"'(.*?)'",response)[0] if __name__=="__main__": for i in range(0,1000): # print(ports('baidu.com', str(i))) threading.Thread(target=ports,args=('baidu.com', str(i))).start()
python教程
Python爬取站长之家端口扫描接口
- python爬虫
- Python爬取
-
Python好看视频地址解析下载代码
#encoding:utf-8# 好看视频下载 import socketfrom urllib.request import urlopenimport urllibimport reimport timefrom pyquery import PyQuery as pqimport requestsfrom tqdm import tqdm # 打印进度条的库import gzip print('程序开始运...
-
python美女写真图库爬虫
import requestsfrom lxml import etreeimport csvfrom time import sleepimport osfrom concurrent.futures import ThreadPoolExecutor headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit...
-
笔趣阁小说网Python爬虫分享
#[url=https://www.biquge.info/wanjiexiaoshuo/]https://www.biquge.info/wanjiexiaoshuo/[/url] 笔趣阁小说全本爬虫import timeimport requestsimport osimport randomfrom lxml import etreeimport webbrowserheader = { "User-Agent": "Mo...
-
Python平台热搜热文爬取代码
前言分享一段Python爬取各大平台热搜热文信息,支持微博热搜、抖音热搜、百度实时热点、知乎热榜、虎嗅热文、哔哩哔哩全站排行、豆瓣新片,免去一个一个网站的看了,是站长编辑的福音。提示:此代码为Python代码,需要有一点基础才能运行,如果是才能,精准像素推...
-
获取免费的https代理Python代码
前言大家用Python爬网页时候,爬快了被封IP,爬慢了,等的着急,这时候就需要https代理来切换IP了。分享一段获取免费的https代理Python代码,可以快速获取网络上免费的https代理。Python代码from multiprocessing.dummy import Lockimport reimport requestsi...
-
Python爬取知乎内容脚本
题主的数据科学导论作业,关于舆情分析负责信息爬取。可能会对大家有点帮助,如果有哪写的不太好的地方,希望可以告诉我如果不想看,直接用的话把js代码命名为 g_encrypt.js 和python代码放在同一级目录就可以了(要搭建nodejs环境,具体可以参考Nodejs安装及环...