爬视频、爬图片、爬数据一段Python代码轻松搞定_迅雷_下载地址
剖析需求:
一键下载,全部自动完成,无需人工干预
大体方案:
准备采取python措辞完成
代码不超过30行,准备搞定此事
项目履行:
1. 装好迅雷软件
2. 准备开拓环境
python 2.7
3.开拓工具:pyCharm 2019.3
4. 开始编码
a) 第一段依赖库导入
re是正则表达式的库,urllib是url操作模块,Tk是剪贴板
b) 第二段获取网页的源码
c) 第三段通过正则表达式的分组功能,开始获取电视剧下载的URL地址,绿色部分可根据网站URL的构造进行正则表达式的调度
d) 将下载地址组织好后,拷贝到剪切板,并触发迅雷的下载
e) 一个main方法,作为调用程序的入口点,绿色部分可改为你想下载视频的网站页面地址
现在只须要run起来,就直接跳出迅雷下载了,所有的下载地址我们已经都爬到了。点击“立即下载”就OK了。
现在只须要run起来,就直接跳出迅雷下载了,所有的下载地址我们已经都爬到了。点击“立即下载”就OK了。
总结:
1. python非常随意马虎上手
2. 爬网是一个经典的利用场景
3. 这个代码不但可以用来爬视频,略加修正我们以爬各种数据,例如图片,商品信息等,总之大有用处
末了附上完全代码,练习的时候如果有问题,欢迎在评论区见告我,我随时在线答疑。
想更详细理解python爬虫技能的同学,可以移步Python爬虫技能实战案例不雅观看视频教程,理解如何在各种网站提取数据。
#!/usr/bin/python import re import urllib from Tkinter import Tk def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getDownload(html): reg = r"<a href=\"(thunder://.+)\" title" downloadlist = re.findall(reg,html) return downloadlist def copyToClipboard(data): all="" for i in range(len(data)): s = str(data[i]).replace('[', '').replace(']', '') s = s.replace("'", '').replace(',', '') + '\n' all = all + s r = Tk() r.withdraw() r.clipboard_clear() r.clipboard_append(all) r.update() # now it stays on the clipboard after the window is closed r.destroy() if __name__ == '__main__': copyToClipboard(getDownload(getHtml("https://www.loldytt.com/Zuixingangju/ZGBQ/")))
本文为东方瑞通韩梅老师原创,请勿转载。
本文系作者个人观点,不代表本站立场,转载请注明出处!