https://annas-archive.org/blog/backing-up-spotify.html

根据 annas-archive的消息和reddit 的讨论

主要内容与细节

  • 文件规模

    • 总计约 300TB。
    • 包含 8600 万首歌曲 的音频文件(约占 Spotify 总曲库 2.56 亿首的 37%),但这些歌曲覆盖了 Spotify 上 99.6% 的总播放次数(优先刮取热门歌曲)。
    • 完整元数据(metadata)几乎覆盖所有 2.56 亿首歌曲,包括艺术家、专辑、封面、音频特征等(已成为全球最大的公开音乐元数据集合)。
    • 未包含播放次数为 0 的低热度歌曲(多为 AI 生成或低质量内容),否则需额外 700TB+ 空间。
  • 音质

    • 大部分为 OGG Vorbis 160kbit/s(Spotify 标准质量),部分低热度歌曲为 75kbit/s。
    • 非无损(lossless/FLAC),社区有人批评质量不足,但也有人认为“有总比没有好”,适合保存主流音乐。
  • 释放方式

    • 分阶段 torrent 释放:先是元数据(已释放,约 186GB),随后按热度顺序释放音乐文件、专辑封面、补丁文件(用于还原原始 Spotify 文件)等。
    • 目标是建立“全球首个完全开放的音乐保存档案”,任何人有足够硬盘即可镜像(mirror)。
  • 刮取方式

    • Anna's Archive 表示“发现了一种大规模刮取 Spotify 的方法”,可能利用 API 或绕过反机器人措施,细节未公开。
    • Spotify 官方回应:确认有第三方非法刮取公开元数据并绕过 DRM 下载部分音频,已禁用相关账号并正在调查,称其为“恶意行为”。

社区反应

  • 兴奋与赞赏

    • 许多人视其为音乐保存的重大成就(“终于我的歌能被分享了”“这是数据囤积的圣杯”)。
    • 讨论用元数据自建音乐 App、分析音乐趋势(例如某些子类型意外受欢迎)。
    • 部分人分享自身囤积规模(有人有数 PB 数据),并呼吁大家 seeding(做种)帮助保存。
  • 担忧与批评

    • 法律风险:预测音乐产业(RIAA 等)会强烈反击,可能导致 Anna's Archive 被封锁、域名下架,或 ISP 封锁(德国已有先例)。但因开源和分散式 torrent,有人乐观认为难以彻底消灭。
    • 质量与完整性:批评只刮热门歌,忽略稀有/小众音乐;音质非无损,有人建议从 Qobuz/Tidal 抓 FLAC 更好。
    • 实用性:300TB 太大,普通人存不起;更适合 AI 训练或大规模镜像,而非个人听歌。
    • 其他:幽默讨论(如“音乐产业要跟俄罗斯开战了”,Anna's Archive 据传在俄罗斯较安全);担心 Spotify 加强防护影响正常使用。
  • 整体氛围:参与度很高(8000+ 赞、600+ 评论),DataHoarder 社区大多支持保存精神,但也理性讨论成本、风险和替代方案(如私人 tracker Redacted.ch 的无损音乐)。

总之,这件事被视为音乐数字保存的里程碑,但也引发版权、质量和可持续性的激烈争论。目前元数据已可下载,音乐文件正在陆续释放中,Spotify 正在调查。

标签: Spotify

添加新评论