.利用python获得豆瓣电影前30部电影的中文片名，排名，导演，主演，上映时间...，python爬虫入门教程!全网VIP电影资源下载助手

专业自媒体运营推广——顾家有收入两不误

电话+V： 152079-09430 ，欢迎咨询爬虫看电影免费代码，[专业自媒体运营推广]，[自媒体商圈业内交流]，[各种运营推广课程]，[解决从零到一的问题]，[让你站在风口忘记焦虑]

一、.利用python获得豆瓣电影前30部电影的中文片名，排名，导演，主演，上映时间...

热门频道

首页

博客

研修院

VIP

APP

问答

下载

社区

推荐频道

活动

招聘

专题

打开CSDNAPP

打开APP

python网络爬虫1.2获取豆瓣TOP250电影的中英文名、港台名、导演、上映年份、电影分类以及评分，将数据存入文档。原创

2021-07-1901:03:15

2点赞

zynaln

码龄8年

关注

题目：

获取豆瓣TOP250电影的中英文名、港台名、导演、上映年份、电影分类以及评分，将数据存入文档。

代码：

输出结果：

文章知识点与官方知识档案匹配

Python入门技能树网络爬虫urllib

201761人正在系统学习中

打开CSDNAPP，看更多技术内容

最新发布用python爬取豆瓣影评及影片信息(评论时间、用户ID、评论内容)

用python爬取豆瓣影评及影片信息(评论时间、用户ID、评论内容)

继续访问

python

写评论

踩

二、第5课实例二:爬取电影

1.选择一个网站：https://www.douban.com

2.在进行爬取之前，我们先去看看它的robots协议。

协议网址：https://www.douban.com/robots.txt

3.进入首页https://movie.douban.com/top250?start=0filter=，打开检查工具，在Elements里查看这个网页，是什么结构。

点击开发者工具左上角的小箭头，选中“肖申克的救赎”，这样就定位了电影名的所在位置，审查元素中显示<spanclass="title">：<span>标签内的文本，class属性；推荐语和评分也是如此，<spanclass='inq'>，<spanclass='rating_num'>；序号：<emclass>，<em>标签内的文本，class属性；推荐语<spanclass='inq'>；链接是<a>标签里href的值。最后，它们最小共同父级标签，是<li>。

4.我们再换个电影验证下找的规律是否正确。

5.check后，我们再看一共10页，每页的url有什么相关呢？

第1页：https://movie.douban.com/top250?start=0filter=

第3页：https://movie.douban.com/top250?start=50filter=

第7页：https://movie.douban.com/top250?start=150filter=

发现只有start后面是有变化，规律就是第N页，start=(N-1)*25

6.基于以上分析，我们有两种写爬虫的思路。

思路一：先爬取最小共同父级标签<li>，然后针对每一个父级标签，提取里面的序号/电影名/评分/推荐语/链接。

思路二：分别提取所有的序号/所有的电影名/所有的评分/所有的推荐语/所有的链接，然后再按顺序一一对应起来。

importrequests#引用requests库

frombs4importBeautifulSoup#引用BeautifulSoup库

res_films=requests.get('https://movie.douban.com/')#获取数据

bs_films=BeautifulSoup(res_films.text，'html.parser')#解析数据

fil_title=bs_films.find_all(class_='title')

fil_num=bs_films.find_all(class_="")

list_all=[]#创建一个空列表，用于存储信息

forxinrange(len(fil_num)):

list_films=[fil_num[x].text[18:-14]，fil_title[x].find('a')['href']]

list_all.append(list_films)

python爬虫入门教程！全网VIP电影资源下载助手

原创2021-02-2518:01·吾爱pythonHello，我长沙吴彦祖又回来啦~~

前言对于Python爬虫相信很多人都不会陌生，我们可以用它来批量下载文字、图片、视频等任意数据资源。

在本次课程中我将会给大家介绍一款能够搜索下载VIP电影资源的工具，只要你安装了Python环境就可以进行使用，零基础也能轻松学会。

下面我们就正式开始对该工具的接口进行分析，准备好了嘛？

界面分析

接下来，先来观察一下代码运行之后的初始化界面。

初始化界面

从界面中可以看到，我们提供两个搜索的接口，分别是根据榜单以及关键字来进行搜索，得到需要的电影资源。

当搜索完成之后，可以在下方的影片名称看到对应的资源，单击电影名称，在右侧的影片详情中能可能到更多关于电影资源的介绍。

影片详情

获取到具体的影片资料后，点击按钮初始化，就能够得到电影的在线观看地址、云盘搜索地址和影视下载地址啦。

影片结果

代码思路分析了解完下载工具的使用之后，接下来给大家介绍一下，整体代码的实现思路。

首先整个工具分为了两个模块，第一个通过tkinter模块实现，工具的可视化界面内容，第二个则是获取数据背后的逻辑实现。

在可视化界面中进行的任何操作，背后都会触发对应的函数内容，通过requests模块进行数据请求，得到响应内容之后，再把数据显示到可视化界面中。

有需要工具的小伙伴可以在评论区留言哦，接下来还会更新一系列好玩的工具。

感谢关注~

【GSFAI BANK FINANCING】尊享直接对接老板

电话+V： 152079-09430

专注于自媒体运营推广配套流程服务方案。为企业及个人客户提供了高性价比的运营方案，解决小微企业和个人创业难的问题