• 售前

  • 售后

热门帖子
入门百科

Python基于爬虫实现全网搜索并下载音乐

[复制链接]
玻璃杯儿敌 显示全部楼层 发表于 2021-10-25 19:19:54 |阅读模式 打印 上一主题 下一主题
如今写一篇博客总是喜好先谈需求大概本内容的应用场景,是的,假如写出来的东西没有任何应用代价,确实也没有现实意义。本日的最早的需求是来自于怎样免费[白嫖]下载全网优质音乐,我去b站上面搜索到了一个大牛做过的一个歌曲搜素神器,界面是这样的:

确实很好用的,而且涵盖了互联网上面大多数主流的音乐网站,涉及到的版本也很多,可谓大而全,但是一个技术人的寻求远远不会云云,于是我就想去了解此中背后的原理,因为做过网络爬虫的人都知道,爬虫只能爬取某一页大概某些页的网站资源,以是我很好奇它背后是怎么实现的?
笔者不绝以来都是做的基于Python3.7版本的网络爬虫,以是本文也是基于此来学习记录的。起首爬取的网站不是对应的音乐网站,而是一个音乐直链搜索,那边汇聚了大多数音频音乐的剖析功能,界面如下:

以是自制一个搜索引擎的思想也很直观了,那就是利用第三方的接口,直接对该服务器发起哀求即可,然后将获取的数据举行剖析生存。这里以近来比力火的歌曲“白月光与朱砂痣”下载为例:

剖析的结果如上,获取的数据格式是json范例,并且除了要有歌名以外,还要有音乐平台。
源代码实现如下:
  1. import requests
  2. import jsonpath
  3. import os
  4. """
  5.   1.url
  6.   2.模拟浏览器请求
  7.   3.解析网页源代码
  8.   4.保存数据
  9. """
  10. def song_download(url,title,author):
  11.   # 创建文件夹
  12.   os.makedirs("music",exist_ok=True)
  13.   path = 'music\{}.mp3'.format(title)
  14.   print('歌曲:{0}-{1},正在下载...'.format(title,author))
  15.   # 下载(这种读写文件的下载方式适合少量文件的下载)
  16.   content = requests.get(url).content
  17.   with open(file = title + author + '.mp3',mode='wb') as f:
  18.     f.write(content)
  19.   print('下载完毕,{0}-{1},请试听'.format(title,author))
  20. def get_music_name():
  21.   """
  22.   搜索歌曲名称
  23.   :return:
  24.   """
  25.   name = input("请输入歌曲名称:")
  26.   print("1.网易云:netease\n2.QQ:qq\n3.酷狗:kugou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya")
  27.   platfrom = input("输入音乐平台类型:")
  28.   print("-------------------------------------------------------")
  29.   url = 'https://music.liuzhijin.cn/'
  30.   headers = {
  31.     "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
  32.     # 判断请求是异步还是同步
  33.     "x-requested-with":"XMLHttpRequest",
  34.   }
  35.   param = {
  36.     "input":name,
  37.     "filter":"name",
  38.     "type":platfrom,
  39.     "page": 1,
  40.   }
  41.   res = requests.post(url=url,data=param,headers=headers)
  42.   json_text = res.json()
  43.   title = jsonpath.jsonpath(json_text,'$..title')
  44.   author = jsonpath.jsonpath(json_text,'$..author')
  45.   url = jsonpath.jsonpath(json_text, '$..url')
  46.   if title:
  47.     songs = list(zip(title,author,url))
  48.     for s in songs:
  49.       print(s[0],s[1],s[2])
  50.     print("-------------------------------------------------------")
  51.     index = int(input("请输入您想下载的歌曲版本:"))
  52.     song_download(url[index],title[index],author[index])
  53.   else:
  54.     print("对不起,暂无搜索结果!")
  55. if __name__ == "__main__":
  56.   get_music_name()
复制代码
演示一下运行结果:


然后文件下就会出现对应的歌曲.mp3文件

并且每次的歌曲检索都是在PyCharm专业版的控制台中举行的,这样的用户体验就非常糟糕,以是针对以上两个标题,我对源代码举行了改进。
  1. # 导入模块
  2. from tkinter import *
  3. import requests
  4. import jsonpath
  5. import os
  6. from urllib.request import urlretrieve
  7. # 2.功能实现
  8. """
  9.   1.url
  10.   2.模拟浏览器请求
  11.   3.解析网页源代码
  12.   4.保存数据
  13. """
  14. def song_download(url,title,author):
  15.   # 创建文件夹
  16.   os.makedirs("music",exist_ok=True)
  17.   path = 'music\{}.mp3'.format(title)
  18.   text.insert(END,'歌曲:{0}-{1},正在下载...'.format(title,author))
  19.   # 文本框滑动
  20.   text.see(END)
  21.   # 更新
  22.   text.update()
  23.   # 下载
  24.   urlretrieve(url,path)
  25.   text.insert(END,'下载完毕,{0}-{1},请试听'.format(title,author))
  26.   # 文本框滑动
  27.   text.see(END)
  28.   # 更新
  29.   text.update()
  30. def get_music_name():
  31.   """
  32.   搜索歌曲名称
  33.   :return:
  34.   """
  35.   name = entry.get()
  36.   platfrom = var.get()
  37.   # name = '白月光与朱砂痣'
  38.   url = 'https://music.liuzhijin.cn/'
  39.   headers = {
  40.     "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
  41.     # 判断请求是异步还是同步
  42.     "x-requested-with":"XMLHttpRequest",
  43.   }
  44.   param = {
  45.     "input":name,
  46.     "filter":"name",
  47.     "type":platfrom,
  48.     "page": 1,
  49.   }
  50.   res = requests.post(url=url,data=param,headers=headers)
  51.   json_text = res.json()
  52.   title = jsonpath.jsonpath(json_text,'$..title')
  53.   author = jsonpath.jsonpath(json_text,'$..author')
  54.   url = jsonpath.jsonpath(json_text, '$..url')
  55.   print(title,author,url)
  56.   song_download(url[0],title[0],author[0])
  57. # 1.用户界面
  58. # 创建画板
  59. root = Tk()
  60. # 设置窗口标题
  61. root.title('全网音乐下载器')
  62. # 设置窗口大小以及出现的位置
  63. root.geometry('560x450+400+200')
  64. # 标签组件
  65. label = Label(root,text="请输入下载的歌曲:",font=('楷体',20))
  66. # 定位与布局
  67. label.grid(row=0)
  68. # 输入框组件
  69. entry = Entry(root,font=('宋体',20))
  70. entry.grid(row=0,column=1)
  71. # 单选按钮
  72. var = StringVar()
  73. r1 = Radiobutton(root,text='网易云',variable=var,value='netease')
  74. r1.grid(row=1,column=0)
  75. r2 = Radiobutton(root,text='QQ',variable=var,value='qq')
  76. r2.grid(row=1,column=1)
  77. # 列表框
  78. text = Listbox(root,font=('楷体',16),width=50,height=15)
  79. text.grid(row=2,columnspan=2)
  80. # 下载按钮
  81. button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name)
  82. button1.grid(row=3,column=0)
  83. button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit)
  84. button2.grid(row=3,column=1)
  85. # 显示界面
  86. root.mainloop()
复制代码
我们再来看看结果吧


这样加上了UI界面和部门代码优化之后,就可以通过.py代码打包成.exe文件发布给用户利用了。
以上就是Python基于爬虫实现全网搜索并下载音乐的详细内容,更多关于python 爬虫下载音乐的资料请关注草根技术分享别的干系文章!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作