• 售前

  • 售后

热门帖子
入门百科

用python制作个论文下载器(图形化界面)

[复制链接]
乔峰之逆风痰 显示全部楼层 发表于 2021-10-26 14:40:07 |阅读模式 打印 上一主题 下一主题
目次


  • 一、利用分析
  • 二、代码分析

    • 1. 功能函数
    • 2. 回调函数
    • 3. 线程天生函数
    • 4. 效果展示

  • 写在末了
在科研学习的过程中,我们不免需要查询相干的文献资料,而想必很多小同伴都知道SCI-HUB,此乃一大神器,它可以资助我们搜刮相干论文并下载其原文。可以说,SCI-HUB造福了众多科研职员,用起来也是“美滋滋”。
在上一篇文章中先容了分析过程以及相应的函数代码。根据小同伴们的反映发现了一些问题,毕竟下令框的情势用起来不免没那么“丝滑”。为了让大家更方便地利用,可以“纵享丝滑”,kimol君决定写一个图形界面(GUI):

PS.由于近期实属忙到晕厥,这是kimol君用疯狂压榨出来的时间写的,所以界面比力简陋,还望大家多多体谅哦~

一、利用分析


这个小玩意儿我们姑且称之为“SCI-Downloader”好了~
它支持单篇论文下载和批量论文下载:
      
  • 单篇下载:在论文标题栏输入论文的标题、DOI号或PMID号,然后选择论文存储的目次,点击开始即可!  
  • 批量下载:在论文标题那边选择一个.txt文本,文本里面包罗了每篇需要下载的论文,其格式如下:

然后,emmm…没有然后了~
就是这么简朴快捷,还不快来试试看,等啥呢?

二、代码分析


本次图形界面的开发是基于PyQT5的,具体界面的布置这里就不过多的先容了,主要是对此中的功能实现进行分析:
着实思路很简朴,由于之前已经有了论文下载的相干函数,我们只需要界说一个Button,然后将其绑定到下载函数即可。
这有啥?完全没难度嘛。然而,你试过就会知道,界面卡顿了。这是由于下载函数所斲丧的时间较长,如果让它直接在主线程里面实行的话,将会和维持界面的主程序冲突,从而出现卡顿。因此,我们将要用到QThread来实行功能函数,回调函数来进行界面更新,示意图如下:

当然,这个示意图并不是那么严谨,大家辩证地看看就好了。这么一来,每个功能即可分为三个部门:Qthread类的功能函数、回调函数、线程天生函数(该函数与Button直接绑定)。

1. 功能函数


继续Qthread类,并对此中的run函数进行重界说,这是实现具体功能的模块,而且把状态通过signal的方式通报给回调函数:
  1. class runthread(QtCore.QThread):
  2. # 通过类成员对象定义信号对象
  3. _signal = QtCore.pyqtSignal(str)
  4. def __init__(self, titleText, saveText):
  5.   super(runthread, self).__init__()
  6.   self.titleText = titleText
  7.   self.saveText = saveText
  8. def __del__(self):
  9.   self.wait()
  10. def run(self):
  11.   if self.titleText == '' or self.saveText == '': # 如果为空
  12.    self._signal.emit('EMPTY')
  13.    return
  14.   headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',
  15.      'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
  16.      'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
  17.      'Accept-Encoding':'gzip, deflate, br',
  18.      'Connection':'keep-alive',
  19.      'Upgrade-Insecure-Requests':'1'}
  20.   if not self.titleText.endswith('.txt'): # 如果不为目录(即单篇论文标题)
  21.    self._signal.emit('SEARCH')
  22.    downUrl = search_article(self.titleText)
  23.    if downUrl == '': # 如果搜索结果为空
  24.     self._signal.emit('NULL')
  25.     return
  26.    else:
  27.     try:
  28.      self._signal.emit('DOWNLOAD')
  29.      res = requests.get(downUrl, headers=headers, stream=True)
  30.      fileSize = int(res.headers['Content-Length'])
  31.      print(fileSize)
  32.      savedSize = 0
  33.      saveName = change_title(self.titleText)
  34.      with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
  35.       for chunk in res.iter_content(chunk_size=1024):
  36.        if chunk:
  37.         f.write(chunk)
  38.         savedSize += len(chunk)
  39.         progress = int(savedSize/fileSize*100)
  40.         self._signal.emit('PRO-%d'%progress)
  41.      self._signal.emit('SUCCESS')   
  42.     except:
  43.      self._signal.emit('FAILED')
  44.   else:
  45.    paperList = read_file(self.titleText)
  46.    if paperList == '':
  47.     self._signal.emit('FILEWRONG')
  48.    else:
  49.     error = [] # 用于记录失败的论文
  50.     self._signal.emit('BATCH-%d'%len(paperList))
  51.     for i in range(len(paperList)):
  52.      try:
  53.       downUrl = search_article(paperList[i])
  54.       print(downUrl)
  55.       pdf = download_article(downUrl)
  56.       saveName = change_title(paperList[i])
  57.       with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
  58.        f.write(pdf)
  59.      except:
  60.       error.append(paperList[i])
  61.      self._signal.emit('NUM-%d'%(i+1))
  62.     with open('./errors.txt', 'w') as f:
  63.      for e in error:
  64.       f.write(e+'\n')
  65.     self._signal.emit('COMPLETED-%d'%len(error))
复制代码
2. 回调函数


通过监听来自功能函数的信号,对界面进行相应的更新,例如错误提示或者下载完毕提示等等:
  1. def call_backrun(self, msg):
  2. if msg == 'EMPTY':
  3.   QtWidgets.QMessageBox.warning(self.centralwidget, '警告', '标题或目录为空!')
  4. if msg == 'SEARCH':
  5.   self.runButton.setVisible(False)
  6.   self.quitButton.setVisible(False)
  7.   self.searchLabel.setVisible(True)
  8. if msg == 'NULL':
  9.   self.runButton.setVisible(True)
  10.   self.quitButton.setVisible(True)
  11.   self.searchLabel.setVisible(False)
  12.   QtWidgets.QMessageBox.information(self.centralwidget, '提示', '未搜到相应论文!')
  13. if msg == 'DOWNLOAD':
  14.   self.searchLabel.setVisible(False)
  15.   self.progressBar.setVisible(True)
  16.   self.progressBar.setFormat('%%p')
  17.   self.progressBar.setValue(0)
  18. if 'PRO' in msg:
  19.   pro = int(msg.split('-')[-1])
  20.   self.progressBar.setValue(pro)
  21. if msg == 'SUCCESS':
  22.   self.progressBar.setVisible(False)
  23.   self.runButton.setVisible(True)
  24.   self.quitButton.setVisible(True)
  25.   self.titleEdit.setText('')
  26.   QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!')
  27. if msg == 'FAILED':
  28.   self.progressBar.setVisible(False)
  29.   self.runButton.setVisible(True)
  30.   self.quitButton.setVisible(True)
  31.   QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载失败!')
  32. if msg == 'FILEWRONG':
  33.   QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文列表错误!')
  34. if 'BATCH' in msg:
  35.   sumNumber = msg.split('-')[-1]
  36.   self.runButton.setVisible(False)
  37.   self.quitButton.setVisible(False)
  38.   self.progressBar.setVisible(True)
  39.   self.progressBar.setFormat('【%v/'+sumNumber+'】')
  40.   self.progressBar.setMinimum(0)
  41.   self.progressBar.setMaximum(int(sumNumber))
  42.   self.progressBar.setValue(0)
  43. if 'NUM' in msg:
  44.   num = int(msg.split('-')[-1])
  45.   self.progressBar.setValue(num)
  46. if 'COMPLETED' in msg:
  47.   errorNum = int(msg.split('-')[-1])
  48.   self.progressBar.setVisible(False)
  49.   self.runButton.setVisible(True)
  50.   self.quitButton.setVisible(True)
  51.   self.titleEdit.setText('')
  52.   QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!\n(%d个失败)'%errorNum)
复制代码
3. 线程天生函数


这个函数与相应的按钮(Button)绑定,当触发时即创建一个对应的功能函数线程:
  1. def run(self):
  2. titleText = self.titleEdit.text()
  3. saveText = self.saveEdit.text()
  4. # 创建线程
  5. self.runthread = runthread(titleText, saveText)
  6. # 连接信号
  7. self.runthread._signal.connect(self.call_backrun) # 进程连接回传到GUI的事件
  8. # 开始线程
  9. self.runthread.start()
复制代码
4. 效果展示


大功告成之后,点击开始按钮,一键入魂:

无数的论文正在快马加鞭地向我奔来~

写在末了


通过简朴地测试,功能根本上没有太大的问题,就是界面可能相对比力简陋,后续如果偶然间的话我也将连续更新,当然也接待各位大大提出名贵的意见呀~
此外,为了让大家更方便地利用,我已经将代码打包exe可实行文件,双击即可开启新天下的大门,不爽吗?
下载地址:https://wws.lanzous.com/iQE7Akpafid
以上就是用python制作个论文下载器(图形化界面)的具体内容,更多关于python 论文下载器的资料请关注脚本之家其它相干文章!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作