本站停止维护,已转移至laravel学习网;欢迎大家移步访问!

使用python模拟登录一品威客并获取个人信息

我们都知道,python是很好的爬虫工具,我们可以通过python制作爬虫,对于一些需要登录的页面,我们可以登录并且但参数请求,今天我们来试一下登录一品威客并获取个人信息,这里会涉及到一个动态的token,我们直接获取就可以了

#!/usr/bin/python 
# -*- coding:utf8 -*-
import HTMLParser 
import urlparse 
import urllib 
import urllib2 
import cookielib 
import string 
import re 
from bs4 import BeautifulSoup
def get_code():
response = urllib2.urlopen("http://www.epwk.com/login.html")
html = response.read()
soup = BeautifulSoup(html,"html.parser")
urlInfo = soup.find_all("input")
token = urlInfo[0]["value"]
return token
def login(_token):
hosturl = "http://www.epwk.com/login.html"
posturl = "http://www.epwk.com/index.php?do=login"
cj = cookielib.LWPCookieJar()  
cookie_support = urllib2.HTTPCookieProcessor(cj)  
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler)  
urllib2.install_opener(opener)
h = urllib2.urlopen(hosturl)
headers = {'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.76 Mobile Safari/537.36','Referer':'http://www.epwk.com/login.html'}
#密码为md5加密
postData = {'txt_account':'','pwd_password':'','formhash':_token,'login_type':'3','ckb_cookie':'0','hdn_refer':'http://www.epwk.com/','txt_code':'','pre':'login','inajax':'1'}
postData = urllib.urlencode(postData)
requesturl = urllib2.Request(posturl, postData, headers)
# print requesturl
response = urllib2.urlopen(requesturl)
text = response.read()
# print text
response = urllib2.urlopen("http://i.epwk.com/Home/Index/index.html")
html = response.read()
soup = BeautifulSoup(html,"html.parser")
urlInfo = soup.find_all("h3")
print urlInfo[1]
_token = get_code()
login(_token)

好了,这样我们就可以获取到了个人信息了,注意这里用到了一个BeautifulSoup包,这个在我们采集额中很有帮助,你可以安装一个试试哦!

转载请注明 :一沙网络原文出处:http://bbs.earnp.com/article/202
问题交流群 :562864481
0
打赏
发布时间 :2016-10-18 18:36:31
分享

0 个评论

    还没有评论,感觉来抢沙发吧!

要回复文章请先登录注册