• 售前

  • 售后

热门帖子
入门百科

python爬取分析超等大乐透历史开奖数据

[复制链接]
哪吒2017 显示全部楼层 发表于 2021-10-25 19:54:15 |阅读模式 打印 上一主题 下一主题
博主作为爬虫初学者,本次利用了requests和beautifulsoup库进行数据的爬取
爬取网站:http://datachart.500.com/dlt/history/history.shtml —500彩票网
(分析后发现网站源代码并非是通过页面跳转来查找不同的数据,故可通过F12查找network栏找到真正储存全部历史开奖结果的网页)
如图:

爬虫部分
[code]from bs4 import BeautifulSoup #引用BeautifulSoup库import requests     #引用requestsimport os      #osimport pandas as pdimport csvimport codecslst=[]url='http://datachart.500.com/dlt/history/newinc/history.php?start=07001&end=21018'r = requests.get(url)      r.encoding='utf-8'text=r.textsoup = BeautifulSoup(text, "html.parser")tbody=soup.find('tbody',id="tdata")tr=tbody.find_all('tr')td=tr[0].find_all('td')for page in range(0,14016): td=tr                            12下一页阅读全文

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作