Coder Social home page Coder Social logo

dedededede / tiktokdownloader Goto Github PK

View Code? Open in Web Editor NEW

This project forked from joeanamier/tiktokdownloader

0.0 0.0 0.0 8.09 MB

完全开源,基于 Requests 模块实现的 TikTok 视频/图集/原声;抖音视频/图集/直播/原声/合集/评论/账号/搜索数据采集工具。

License: GNU General Public License v3.0

JavaScript 19.96% Python 37.66% CSS 20.03% HTML 5.87% SCSS 16.47%

tiktokdownloader's Introduction

TikTokDownloader

TikTokDownloader

GNU General Public License v3.0 TikTokDownloader Sourcery stars 群聊

🔥 TikTok 视频/图集/原声;抖音视频/图集/直播/原声/合集/评论/账号/搜索数据采集工具:完全开源,基于 Requests 模块实现;批量下载抖音账号发布页或者喜欢页的作品;单独下载抖音链接或 TikTok 链接对应的作品;获取抖音直播推流地址;下载抖音直播视频;抓取抖音作品评论数据;批量下载抖音合集作品;采集抖音账号详细数据;采集抖音用户/作品搜索结果。


📝 功能清单

  • ✅ 下载抖音无水印视频/图集
  • ✅ 下载 TikTok 无水印视频/图集
  • ✅ 批量下载抖音账号发布页/喜欢页作品
  • ✅ 单独下载抖音链接作品
  • ✅ 单独下载 TikTok 链接作品
  • ✅ 支持单次输入多个链接
  • ✅ 多账号批量下载作品
  • ✅ 自动跳过已下载的文件
  • ✅ 持久化保存采集数据
  • ✅ 下载动态/静态封面图
  • ✅ 获取抖音直播推流地址
  • ✅ 下载抖音直播视频
  • ✅ Web UI 交互界面
  • ✅ 抓取抖音作品评论数据
  • ✅ 批量下载抖音合集作品
  • ✅ 记录点赞收藏等统计数据
  • ✅ 筛选作品发布时间
  • ✅ 可实现作品增量更新
  • ✅ 支持使用代理采集数据
  • ✅ 支持局域网远程访问
  • ✅ 采集抖音账号详细数据
  • ✅ 作品统计数据更新
  • ✅ 自动更新账号昵称
  • ✅ 直接部署至公开服务器
  • ✅ 采集抖音搜索结果
  • ☑️ 采集账号关注列表
  • ☑️ 批量下载抖音账号收藏作品
  • ☑️ 采集抖音账号收藏合集列表

💻程序界面

终端模式:

终端模式截图


终端模式截图

Web UI 交互模式:

WebUI模式截图


WebUI模式截图

📈 项目状态

  • 🟢 Releases 发布的源码已通过测试,功能均可正常使用
  • 🟡 准备开发获取账号关注列表功能
  • 🟡 准备开发批量下载账号收藏作品功能
  • 🟡 准备开发获取账号收藏合集列表功能
  • 🟡 准备开发多进程模式,提高多账号批量下载效率
  • 🔴 最新版本的源码可能存在不稳定的 Bug
  • 🔴 如果在使用过程中发现 Bug,请及时告知作者修复

📁 项目结构

TikTokDownloader
├─ main.py                                 // 项目程序启动入口
├─ requirements.txt                        // 程序所需第三方模块信息
├─ settings.json                           // 运行参数配置文件
├─ src                                     // 项目模块源码文件夹
│    ├─ CookieTool.py                      // Cookie 写入模块
│    ├─ Configuration.py                   // 配置文件处理模块
│    ├─ DataAcquirer.py                    // 接口数据获取模块
│    ├─ DataDownloader.py                  // 作品文件下载模块
│    ├─ FileCache.json                     // 文件管理缓存数据
│    ├─ FileManager.py                     // 作品文件管理模块
│    ├─ Parameter.py                       // 加密参数生成模块
│    ├─ Recorder.py                        // 日志及数据记录模块
│    ├─ StringCleaner.py                   // 非法字符处理模块
│    ├─ main_complete.py                   // 单进程启动入口
│    ├─ main_multiprocess.py               // 多进程启动入口
│    ├─ main_server.py                     // 服务器启动入口
│    └─ main_web_UI.py                     // Web UI 启动入口
├─ static                                  // 静态资源文件夹
├─ templates                               // HTML 模板文件夹
└─ docs                                    // 项目文档文件夹

📋 使用说明

使用方法:

  1. 安装不低于 3.10 版本的 Python 解释器
  2. 安装 Node.js (JavaScript 运行环境)
  3. 下载最新源码或 Releases 发布的源码至本地
  4. 安装 requirements.txt 包含的第三方模块
  5. 运行 main.py 并选择单进程终端模式,生成默认配置文件
  6. 阅读 README.md 了解项目介绍和配置文件规则
  7. 打开抖音网页版,复制 Cookie 至配置文件(使用 main.py 写入)
  8. 根据下载需求修改 settings.json 配置文件
  9. 再次运行 main.py 即可正常使用
更多程序说明可以查看 issues

关于Cookie:

点击查看 Cookie 获取教程

程序功能 是否需要登录
下载发布页作品
下载喜欢页作品
下载链接作品
获取直播推流地址
下载直播视频
获取作品评论数据
下载合集作品
获取账号数据
采集搜索结果

程序获取数据失败时,可以尝试使用已登录的 Cookie 运行!


程序说明:

  • 程序提示用户输入时,直接回车代表返回上级菜单,输入 Qq 代表结束运行
  • 如果作品没有描述,保存时文件名称的描述内容将替换为作品 ID
  • 由于获取账号喜欢页数据仅返回喜欢作品的发布日期,不返回点赞日期,因此程序需要获取全部喜欢作品数据再进行日期筛选,如果账号喜欢页作品较多,可能会花费较长的时间
  • 使用 SQLite 格式储存数据时,重复获取作品数据将会更新点赞收藏等统计数据
  • 获取私密账号的发布页数据需要登录后的 Cookie,且登录的账号需要关注该私密账号
  • 批量下载账号作品或合集作品时,如果对应的昵称或标识发生变化,程序会自动更新已下载作品文件名称中的昵称和标识
  • 单独下载链接作品时,如果在 name 参数中设置了 mark ,程序会自动替换为 nickname

🔗 链接类型

链接格式 链接内容
https://v.douyin.com/分享码/ 账号、视频、图集、直播、合集
https://www.douyin.com/note/作品ID 图集
https://www.douyin.com/video/作品ID 视频
https://www.douyin.com/collection/合集ID 合集
https://www.douyin.com/user/账号ID?modal_id=作品ID 账号、视频、图集
https://live.douyin.com/直播ID 直播
https://www.tiktok.com/@账号昵称/video/作品ID 账号、视频、图集

⚙️ Settings.json

参数 类型 说明
mark str 账号/合集标识,设置为空字符串代表使用帐号昵称/合集标题
属于 accounts 和 mix 子参数
url str 账号主页链接,批量下载时使用(非视频/图集链接)
属于 accounts 子参数
mode str 批量下载类型,post 代表发布页,favorite 代表喜欢页
需要账号喜欢页公开可见,属于 accounts 子参数
earliest str 作品最早发布日期,格式: 2023/1/1,设置为空字符串代表不限制
属于 accounts 子参数
latest str 作品最晚发布日期,格式: 2023/1/1,设置为空字符串代表不限制
属于 accounts 子参数
accounts
[mark, url, mode, earliest, latest]
list[list[str, str, str, str, str]] 账号标识, 账号链接, 批量下载类型, 最早发布日期, 最晚发布日期;批量下载账号作品时使用,支持多账号,以列表格式包含五个参数
mix[mark, url] list[list[str, str]] 合集标识, 合集链接或作品链接
批量下载合集作品时使用,支持多合集,以列表格式包含两个参数
root str 作品文件和数据记录保存路径,默认值: 当前路径 ./
folder str 下载单独链接作品时,储存文件夹的名称,默认值: Download
name str 文件保存时的命名规则,值之间使用空格分隔
默认值: 发布时间-账号昵称-描述
id: 唯一值, desc: 描述, create_time: 发布时间
nickname: 账号昵称, mark: 账号标识, uid: 账号UID
time str 发布时间的格式,默认值: 年-月-日 时.分.秒
注意: Windows 系统的文件名称不能包含英文冒号 :
split str 文件命名的分隔符,默认值: -
music list[bool] 是否下载作品音乐,默认值: False
save str 采集数据持久化储存格式,设置为空字符串代表不保存
目前支持: csvxlsxsql(SQLite)
cookie list[dict] 抖音网页版 Cookie,必需参数
使用 main.py 写入配置文件
dynamic list[bool] 是否下载动态封面图,默认值: False
original list[bool] 是否下载静态封面图,默认值: False
proxies list[str] 代理地址,设置为空字符串代表不使用代理
log bool 是否记录运行日志,默认值: False
download list[bool] 是否打开下载功能,如果关闭,程序将不会下载任何文件
默认值: True
chunk int 每次从服务器接收的数据块大小,单位字节
默认值:524288(512 KB)
retry int 发送请求获取数据发生异常时重试的最大次数
设置为 0 代表关闭重试,默认值: 10

⚠️ 免责声明

  • 使用者对本项目的使用由使用者自行决定,并自行承担风险。作者对使用者使用本项目所产生的任何损失、责任、或风险概不负责。
  • 本项目的作者提供的代码和功能是基于现有知识和技术的开发成果。作者尽力确保代码的正确性和安全性,但不保证代码完全没有错误或缺陷。
  • 使用者在使用本项目时必须严格遵守 GNU General Public License v3.0 的要求,并在适当的地方注明使用了 GNU General Public License v3.0 的代码。
  • 使用者在任何情况下均不得将本项目的作者、贡献者或其他相关方与使用者的使用行为联系起来,或要求其对使用者使用本项目所产生的任何损失或损害负责。
  • 使用者在使用本项目的代码和功能时,必须自行研究相关法律法规,并确保其使用行为合法合规。任何因违反法律法规而导致的法律责任和风险,均由使用者自行承担。
在使用本项目的代码和功能之前,请您认真考虑并接受以上免责声明。如果您对上述声明有任何疑问或不同意,请不要使用本项目的代码和功能。如果您使用了本项目的代码和功能,则视为您已完全理解并接受上述免责声明,并自愿承担使用本项目的一切风险和后果。

💡 代码参考

tiktokdownloader's People

Contributors

joeanamier avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.