爬虫入门教程

 时间:2024-10-12 17:12:28

1、打开Python编辑器。>>> import requests>>> html = requests.get('百度')这里以百度为示范,引入requests库,对网页进行请求。

爬虫入门教程

3、>>> from bs4 import BeautifulSoup>>> soup = Be锾攒揉敫autifulSoup(html.content, 'lxml')>>> print(soup)这个时候我们需要借助BeautifulSoup和lxml来解析网页,并且打印一下,看一下有没问题问题。

爬虫入门教程爬虫入门教程

6、>>> print(soup.a)>>> print(soup.p)但是我们需求比较多的是要获得便签的内容,比如a和p,但是这里只能返回一个数据。

爬虫入门教程

8、>>> for i in soup.findAll(class_="mnav"): print(i.get("href"))还有一个入门必须知道的就是获取里面的链接,一般都是要获取href。

爬虫入门教程
  • Axure引用html
  • Axure制作网页头部
  • Axure RP8怎样将页面局部转换为母版?
  • Pycharm怎么确保保存的文件均以换行结束
  • 如何用Axure制作动态倒计时
  • 热门搜索
    万绿湖旅游攻略 热气球旅游网 广西南宁旅游景点大全 聊城旅游度假区 彭州白鹿镇旅游攻略 山西旅游景点介绍 旅游日语 泰宁大金湖旅游攻略 西安旅游攻略1天 河南的旅游景点有哪些