spotify 300T 的音乐数据被脱裤了
https://annas-archive.org/blog/backing-up-spotify.html
根据 annas-archive的消息和reddit 的讨论
主要内容与细节
文件规模:
- 总计约 300TB。
- 包含 8600 万首歌曲 的音频文件(约占 Spotify 总曲库 2.56 亿首的 37%),但这些歌曲覆盖了 Spotify 上 99.6% 的总播放次数(优先刮取热门歌曲)。
- 完整元数据(metadata)几乎覆盖所有 2.56 亿首歌曲,包括艺术家、专辑、封面、音频特征等(已成为全球最大的公开音乐元数据集合)。
- 未包含播放次数为 0 的低热度歌曲(多为 AI 生成或低质量内容),否则需额外 700TB+ 空间。
音质:
- 大部分为 OGG Vorbis 160kbit/s(Spotify 标准质量),部分低热度歌曲为 75kbit/s。
- 非无损(lossless/FLAC),社区有人批评质量不足,但也有人认为“有总比没有好”,适合保存主流音乐。
释放方式:
- 分阶段 torrent 释放:先是元数据(已释放,约 186GB),随后按热度顺序释放音乐文件、专辑封面、补丁文件(用于还原原始 Spotify 文件)等。
- 目标是建立“全球首个完全开放的音乐保存档案”,任何人有足够硬盘即可镜像(mirror)。
刮取方式:
- Anna's Archive 表示“发现了一种大规模刮取 Spotify 的方法”,可能利用 API 或绕过反机器人措施,细节未公开。
- Spotify 官方回应:确认有第三方非法刮取公开元数据并绕过 DRM 下载部分音频,已禁用相关账号并正在调查,称其为“恶意行为”。
社区反应
兴奋与赞赏:
- 许多人视其为音乐保存的重大成就(“终于我的歌能被分享了”“这是数据囤积的圣杯”)。
- 讨论用元数据自建音乐 App、分析音乐趋势(例如某些子类型意外受欢迎)。
- 部分人分享自身囤积规模(有人有数 PB 数据),并呼吁大家 seeding(做种)帮助保存。
担忧与批评:
- 法律风险:预测音乐产业(RIAA 等)会强烈反击,可能导致 Anna's Archive 被封锁、域名下架,或 ISP 封锁(德国已有先例)。但因开源和分散式 torrent,有人乐观认为难以彻底消灭。
- 质量与完整性:批评只刮热门歌,忽略稀有/小众音乐;音质非无损,有人建议从 Qobuz/Tidal 抓 FLAC 更好。
- 实用性:300TB 太大,普通人存不起;更适合 AI 训练或大规模镜像,而非个人听歌。
- 其他:幽默讨论(如“音乐产业要跟俄罗斯开战了”,Anna's Archive 据传在俄罗斯较安全);担心 Spotify 加强防护影响正常使用。
- 整体氛围:参与度很高(8000+ 赞、600+ 评论),DataHoarder 社区大多支持保存精神,但也理性讨论成本、风险和替代方案(如私人 tracker Redacted.ch 的无损音乐)。
总之,这件事被视为音乐数字保存的里程碑,但也引发版权、质量和可持续性的激烈争论。目前元数据已可下载,音乐文件正在陆续释放中,Spotify 正在调查。
版权属于:fanqiang.info
本文链接:https://www.fanqiang.info/archives/spotify300tde-yin-le-shu-ju-bei-tuo-ku-le.html
若无特别注明,本文皆为“fanqiang.info”原创,随意转载但请保留文章出处。更多精彩内容在电报频道更新: https://t.me/fqinfo