• 售前

  • 售后

热门帖子
入门百科

python 制作网站小说下载器

[复制链接]
珍爱1103 显示全部楼层 发表于 2021-10-25 20:00:05 |阅读模式 打印 上一主题 下一主题
目次


  • 基本开发环境
  • 相关模块使用
  • 目的网页分析
  • 静态网页的获取,难度是不大的。

    • 1、获取每本小说的章节名以及url地点
    • 2、获取url后,必要拼接
    • 3、小说名字,直接获取即可。

  • 小说软件界面
  • 显示下载内容
  • 实现效果

基本开发环境

· Python 3.6
· Pycharm

相关模块使用



目的网页分析


输入想看的小说内容,点击搜刮

这里会返回很多效果,我只选择第一个
网页数据是静态数据,但是要搜刮,是post哀求,必要提价data参数,如下图所示:

然后通过剖析网站数据,获取第一个小说i的详情页url即可

静态网页的获取,难度是不大的。
  1. def search():
  2.     search_url = 'http://www.xbiquge.la/modules/article/waps.php'
  3.     data = {
  4.         'searchkey': name
  5.     }
  6.     response = requests.post(url=search_url, data=data, headers=headers)
  7.     selector = get_parsing(response.text)
  8.     novel_url = selector.css('.even a::attr(href)').extract_first()
复制代码
1、获取每本小说的章节名以及url地点

所有的章节名以及url地点,都包含在dd标签内里


2、获取url后,必要拼接
  1. '/23/23019/11409705.html' # 这是网页获取到的url
  2. 'http://www.xbiquge.la/23/23019/11409705.html' # 这是真实的小说章节内容url地址
复制代码
3、小说名字,直接获取即可。
  1. def download_one_book(index_url):
  2.     response = get_response(index_url)
  3.     response.encoding = response.apparent_encoding
  4.     sel = get_parsing(response.text)
  5.     book_name = sel.css('#info h1::text').get()
  6.     # 提取了所有章节的下载地址
  7.     urls = sel.css('#list dd a::attr(href)').getall()
  8.     # 不要最新的 12 章放在最前main
  9.     for url in urls:
  10.         chapter_url = 'http://www.xbiquge.la' + url
  11.         print(chapter_url)
复制代码
生存下载每章小说内容
  1. def download_one_chapter(chapter_url, book_name):
  2.     response = get_response(chapter_url)
  3.     response.encoding = response.apparent_encoding
  4.     html = response.text
  5.     selector = get_parsing(html)
  6.     h1 = selector.css('.bookname h1::text').get()
  7.     content = selector.css('#content::text').getall()
  8.     lines = []
  9.  
  10.     for c in content:
  11.         lines.append(c.strip())
  12.     print(h1)
  13.     text = '\n'.join(lines)
  14.     file = open(book_name + '.txt', mode='a', encoding='utf-8')
  15.     file.write(h1)
  16.     file.write('\n')
  17.     file.write(text)
  18.     file.write('\n')
  19.     file.close()
复制代码
小说软件界面
  1. root = Tk()
  2. root.title('小说下载器')
  3. root.geometry('560x450+400+200')
  4.  
  5. label = Label(root, text='请输入下载小说名字:', font=('华文行楷', 20))
  6. label.grid()
  7.  
  8. entry = Entry(root, font=('隶书', 20))
  9. entry.grid(row=0, column=1)
  10.  
  11. text = Listbox(root, font=('隶书', 16), width=50, heigh=15)
  12. text.grid(row=2, columnspan=2)
  13.  
  14. button1 = Button(root, text='开始下载', font=('隶书', 15), command=search)
  15. button1.grid(row=3, column=0)
  16.  
  17. button2 = Button(root, text='退出程序', font=('隶书', 15), command=root.quit)
  18. button2.grid(row=3, column=1)
  19.  
  20. root.mainloop()
复制代码
显示下载内容
  1. def novel_load(title):
  2.     text.insert(END, '正在保存:{}'.format(title))
  3.     # 文本框滚动
  4.     text.see(END)
  5.     # 更新
  6.     text.update()
复制代码
实现效果


以上就是python 制作网站小说下载器的详细内容,更多关于python 小说下载器的资料请关注脚本之家别的相关文章!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作