豆瓣250爬虫

1 利用jsoup 单线程爬取豆瓣250的电影标题 图片URI 以及一句话简介

2 存入redis


先访问一个总的URL

爬取IMG 保存src

再爬取URL 遍历href 递归到第一步


img中含有信息,过滤出,只要PNG类型的,电影封面,最好能保存电影名称

赠人玫瑰 手留余香
JSOUP 爬取 磁力链接
java实现网络爬虫,jsoup入门
立即登录, 发表评论.
没有帐号? 立即注册
0 条评论