
仅仅9行代码 爬取教务处成绩 仅用2个模块 正方教务系统
发布日期:2021-05-06 22:50:21
浏览次数:26
分类:技术文章
本文共 1029 字,大约阅读时间需要 3 分钟。
先挖个坑,最近几天补上,这是个最最最简单的爬虫了吧!
有点标题党了哈,其实把url,header,data都直接填入函数,session不拆开写,确实仅仅9行!然后仅仅9行代码。
想看的先收藏吧,别之后找不到了。之后我会详细说明每一步,抓包分析,请求头,接口返回数据,正则等等。
import requestsimport relogin_url='http://xjw.sdau.edu.cn/jwglxt/xtgl/login_slogin.html?time=1611460078610'grade_url='http://xjw.sdau.edu.cn/jwglxt/cjcx/cjcx_cxDgXscj.html?gnmkdm=N305005&layout=default&su=我的学号'headers={ 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36', }grade_data_2019_3={ 'doType':'query','xqm':'3','xnm':'2019',}login_data = { 'yhm': '我的学号','mm': '我的密码',}session=requests.session()response = session.post(login_url,headers=headers,data=login_data)grade_page = session.post(grade_url,headers=headers,data=grade_data_2019_3) course=re.findall('"kcmc":"(.*?)",',grade_page.text)credit=re.findall('"xf":"(.*?)",',grade_page.text)grade=re.findall('"cj":"(.*?)",',grade_page.text)for i in range(len(course)): print ('课程:' +course[i]+' 学分:' +credit[i]+' 成绩:' +grade[i])
效果如下:

发表评论
最新留言
不错!
[***.144.177.141]2025年03月24日 12时53分09秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!