python爬虫之使用BeautifulSoup模块抓取500彩票网竞彩足球赛果及赔率
竞彩足球是目前比较受欢迎的一种体彩彩种,玩法较为灵活多样,赔率可观,今天就来记录一下如何抓取竞彩足球的开奖信息和赔率。
我使用的网站为500彩票,我们以2021年6月9日的比赛结果为例,该天的比赛结果地址为https://trade.500.com/jczq/?date=2021-06-09,打开网页右键对第一场比赛结果进行审查元素操作,发现比赛的信息和结果储存在tbody下的tr class="bet-tb-tr bet-tb-end"中,那接下来我们对每一场比赛的tr进行分析。
打开第一个tr我们发现所有的内容均储存在class名称不同的td当中,比如开赛时间就储存在td class="td td-endtime"当中,而赔率则储存在td class="td td-betbtn"下的p标签下的span标签当中,我们所需的数据的储存结构和位置都弄清楚以后下一步就简单了。
我们就可以使用BeautifulSoup的find_all方法获取所有的tr标签下的td标签,然后可以根据td的索引和class的名称获取到对应标签的文本内容大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。赔率的话可以在储存赔率的td标签下获取获取span标签即可得到所有的赔率,其他的内容基本都是这个思路只是层数和标签名称不同而已,具体获取方式有很多种,大家可以灵活使用,这里就不一一列举了。
数据的储存我使用的是pandas模块,获取的到数据首先临时储存在字典中,接着将字典转换为pandas的DataFrame数据类型,最后使用merge进行合并和储存为xlsx文件。
数据储存这个部分应该有更加高明和简便的方法,但是本人对于pandas模块还只是一个初学者,所以过程比较繁琐,欢迎各位指教!
BeautifulSoup模块抓取竞彩足球代码:大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!
最终在excel表里面看起来不是很美观,细节方面还需进行美化,凑合着先看一下吧!
如果想抓取多天比赛结果的朋友,可以分析每天赛果url的变化规律,在外面增加一个循环逐天进行抓取!最后欢迎大家在评论区不吝赐教,谢谢!
评论