博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python学习(七)--豆瓣爬取电影名,评分以及演员
阅读量:7165 次
发布时间:2019-06-29

本文共 972 字,大约阅读时间需要 3 分钟。

import requests import re #爬取豆瓣电影排名 pageNum = int(input("要查看第几页电影分数:")) #已知豆瓣默认每页展示20条 #url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start=0&limit=20" url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start="+str((pageNum-1)*20)+"&limit=20" #评分  "rating":["9.6","50"]   此处有中括号[],尽管加了r表示不转译,但是不加斜杠\,仍然匹配不到。 pattern1 = r'"rating":\["(.*?)","\d+"\]' #电影名 pattern2 = r'"title":"(.*?)"' #电影演员 pattern3 = r'"actors":\[(.*?)\]' data = requests.get(url).text print(data) pat1 = re.compile(pattern1) pat2 = re.compile(pattern2) pat3 = re.compile(pattern3) list1 = pat1.findall(data) list2 = pat2.findall(data) list3 = pat3.findall(data) print(list1) print(list2) print(list3) list = [] for i in range(0,len(list1)):     list.append(list2[i]+":"+list1[i]+"分,演员:"+list3[i]) print("---------------------------------------------") for i in list:     print(i)

转载于:https://www.cnblogs.com/fuguang/p/10616208.html

你可能感兴趣的文章