python教程

Python爬取站长之家端口扫描接口

精准像素 2021-05-22 人阅读
import requests,time
import random
from bs4 import BeautifulSoup
import re
import threading
def ports(hostm,port):
    url = 'http://tool.chinaz.com/port/'
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
    }
    data = {
        'host':hostm,
        'port':port
    }
    response = requests.post(url,headers=headers,data=data).text
    encode = BeautifulSoup(response,'html.parser').findAll('input',{"id":"encode"})[0].get('value')
    data['encode'] = encode
    callback = "jQuery113"+str(int(random.random()*100000000000000000))+'_'+str(int(time.time()*1000))
    params = {
        'callback':callback,
        't':'port'
    }
 
    url = 'http://tool.chinaz.com/iframe.ashx'
 
    response = requests.post(url,headers=headers,data=data,params=params).text
 
    response = re.sub(callback,'',response)
    print(re.findall(r"'(.*?)'",response)[0])
 
    return re.findall(r"'(.*?)'",response)[0]
 
 
if __name__=="__main__":
    for i in range(0,1000):
       # print(ports('baidu.com', str(i)))
        threading.Thread(target=ports,args=('baidu.com', str(i))).start()


相关推荐
  • python爬虫
  • Python爬取
  • python美女写真图库爬虫

    import requestsfrom lxml import etreeimport csvfrom time import sleepimport osfrom concurrent.futures import ThreadPoolExecutor headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit...

    python教程 12 1个月前
  • 笔趣阁小说网Python爬虫分享

    #[url=https://www.biquge.info/wanjiexiaoshuo/]https://www.biquge.info/wanjiexiaoshuo/[/url] 笔趣阁小说全本爬虫import timeimport requestsimport osimport randomfrom lxml import etreeimport webbrowserheader = { "User-Agent": "Mo...

    python教程 12 1个月前
  • Python爬取站长之家端口扫描接口

    import requests,timeimport randomfrom bs4 import BeautifulSoupimport reimport threadingdef ports(hostm,port): url = 'http://tool.chinaz.com/port/' headers = { 'User-Agent':'Mozilla/5.0 (Windows NT ...

    python教程 38 4个月前
  • Python平台热搜热文爬取代码

    前言分享一段Python爬取各大平台热搜热文信息,支持微博热搜、抖音热搜、百度实时热点、知乎热榜、虎嗅热文、哔哩哔哩全站排行、豆瓣新片,免去一个一个网站的看了,是站长编辑的福音。提示:此代码为Python代码,需要有一点基础才能运行,如果是才能,精准像素推...

    python教程 11 1个月前
  • 获取免费的https代理Python代码

    前言大家用Python爬网页时候,爬快了被封IP,爬慢了,等的着急,这时候就需要https代理来切换IP了。分享一段获取免费的https代理Python代码,可以快速获取网络上免费的https代理。Python代码from multiprocessing.dummy import Lockimport reimport requestsi...

    python教程 8 1个月前
  • Python爬取知乎内容脚本

    题主的数据科学导论作业,关于舆情分析负责信息爬取。可能会对大家有点帮助,如果有哪写的不太好的地方,希望可以告诉我如果不想看,直接用的话把js代码命名为 g_encrypt.js 和python代码放在同一级目录就可以了(要搭建nodejs环境,具体可以参考Nodejs安装及环...

    python教程 11 1个月前