爬虫入门教程

 时间:2024-10-12 17:12:28

1、打开Python编辑器。>>> import requests>>> html = requests.get('百度')这里以百度为示范,引入requests库,对网页进行请求。

爬虫入门教程

3、>>> from bs4 import BeautifulSoup>>> soup = Be锾攒揉敫autifulSoup(html.content, 'lxml')>>> print(soup)这个时候我们需要借助BeautifulSoup和lxml来解析网页,并且打印一下,看一下有没问题问题。

爬虫入门教程爬虫入门教程

6、>>> print(soup.a)>>> print(soup.p)但是我们需求比较多的是要获得便签的内容,比如a和p,但是这里只能返回一个数据。

爬虫入门教程

8、>>> for i in soup.findAll(class_="mnav"): print(i.get("href"))还有一个入门必须知道的就是获取里面的链接,一般都是要获取href。

爬虫入门教程
  • Axure引用html
  • Axure制作网页头部
  • Axure RP8怎样将页面局部转换为母版?
  • Pycharm怎么确保保存的文件均以换行结束
  • 如何用Axure制作动态倒计时
  • 热门搜索
    吉尔吉斯斯坦旅游 河南旅游景点图片 这个季节去哪旅游最好 红色旅游的意义 阳春旅游 欧洲旅游指南 旅游天地 浙江省旅游地图 哈尔滨周边旅游 成都到丽江旅游