Python:中国大学排名爬取

今天是9月17号,小伙伴们有没有听周董的新歌《说好不哭》呢,哈哈

前两天在学python爬虫,今天做了个小实例,成功了,很开心,虽然很简单,但也还是感觉很满足呀

是对中国大学排名的一个定向网页爬取,网址是:http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html

理解运用的不是特别好,还需要加强

先上代码:

import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
    r =requests.get(url)
    r.encoding=r.apparent_encoding
    return r.text
def fList(ulist,html):
    soup=BeautifulSoup(html,"html.parser")
    for tr in soup.find('tbody').children:
    if isinstance(tr,bs4.element.Tag):
        tds=tr('td')
        ulist.append([tds[0].string,tds[1].string,tds[2].string,tds[3].string])
def pList(ulist,num):
    tplt="{0:^10}{1:{4}^10}{2:^10}{3:^10}"
    tpltt = "{0:^10}\t{1:{4}^10}\t{2:^10}{3:^10}"
    print(tplt.format("排名","学校名称","地区","总分",chr(12288)))
    for i in range(num):
        u=ulist[i]
        print(tpltt.format(u[0],ulist[i][1],ulist[i][2],ulist[i][3],chr(12288)))
if __name__=='__main__':
    uinfo=[]
    url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
    html=getHTMLText(url)
    #print(html)
    fList(uinfo,html)
    pList(uinfo,300)

附张图片:

感觉学了好多东西都是浅尝辄止,希望可以选择一个方向深入下去 :weiqv:

点赞
  1. helloworld说道:
    Google Chrome Windows 10

    牛牛牛

  2. 寒小林说道:
    Google Chrome Windows 10

    有点狠了 :tushe:

发表评论

电子邮件地址不会被公开。必填项已用 * 标注