基于Python 爬虫的慕课视频下载

1. 项目简介:

  • 项目环境为 Windows10, Python3
  • 用 Python3.6 urllib3 模块爬虫,所有涉及模块均为标准库,打包后体积小,不到10M
  • 支持Mooc视频,字幕,课件下载,课程以目录树形式下载到硬盘,支持Potplayer播放
  • 支持中国大学慕课和爱课程二大慕课网站的视频课程下载,核心下载调用 Aria2c

2. 功能演示:

notion image
notion image

4.项目文件

  • Mooc_Main.py 整个项目的主程序, 其实是调用了 Mooc_Interface
  • Mooc_Interface.py 人机交互接口模块
  • Mooc_Config.py Mooc 的配置文件
  • Mooc_Base.py Mooc 抽象基类
  • Mooc_Potplayer.py 用于生成专用于 Potplayer 播放的 dpl 文件
  • Mooc_Request.py 用 urllib 包装的一个Mooc请求库
  • Mooc_Download.py 调用 Aira2c 下载的命令接口
  • Icourses 有关爱课程的模块包
  • Icourse163 有关中国大学慕课的模块包
    • Icourse163_Base.py 中国大学慕课下载器的基类,继承自 Mooc_Base
    • Icourse163_Config.py 配置文件
    • Icourse163_Mooc.py 中国大学慕课下载器得子类,继承自 Icourse163_Base.py

5.运行项目

请确保在项目工程的根目录下,然后在终端输入以下指令(python3 环境,无依赖的第三方模块)
python -m Mooc

6.打包指令

  1. 首先确保已经安装 pyinstaller,若未安装,则用 pip 安装,打开终端,输入:
    1. pip install pyinstaller
  1. 然后在项目工程的根目录下,终端输入:
    1. pyinstaller Mooc.spec
  1. 最后会在项目工程根目录下出现一个dist文件夹,该文件夹会出现一个Mooc-3.4.0.exe程序
badge