https://annas-archive.org/blog/backing-up-spotify.html

根据 annas-archive的消息和reddit 的讨论

主要内容与细节

  • 文件规模

    • 总计约 300TB。
    • 包含 8600 万首歌曲 的音频文件(约占 Spotify 总曲库 2.56 亿首的 37%),但这些歌曲覆盖了 Spotify 上 99.6% 的总播放次数(优先刮取热门歌曲)。
    • 完整元数据(metadata)几乎覆盖所有 2.56 亿首歌曲,包括艺术家、专辑、封面、音频特征等(已成为全球最大的公开音乐元数据集合)。
    • 未包含播放次数为 0 的低热度歌曲(多为 AI 生成或低质量内容),否则需额外 700TB+ 空间。
  • 音质

    • 大部分为 OGG Vorbis 160kbit/s(Spotify 标准质量),部分低热度歌曲为 75kbit/s。
    • 非无损(lossless/FLAC),社区有人批评质量不足,但也有人认为“有总比没有好”,适合保存主流音乐。
  • 释放方式

    • 分阶段 torrent 释放:先是元数据(已释放,约 186GB),随后按热度顺序释放音乐文件、专辑封面、补丁文件(用于还原原始 Spotify 文件)等。
    • 目标是建立“全球首个完全开放的音乐保存档案”,任何人有足够硬盘即可镜像(mirror)。
  • 刮取方式

    • Anna's Archive 表示“发现了一种大规模刮取 Spotify 的方法”,可能利用 API 或绕过反机器人措施,细节未公开。
    • Spotify 官方回应:确认有第三方非法刮取公开元数据并绕过 DRM 下载部分音频,已禁用相关账号并正在调查,称其为“恶意行为”。

社区反应

  • 兴奋与赞赏

    • 许多人视其为音乐保存的重大成就(“终于我的歌能被分享了”“这是数据囤积的圣杯”)。
    • 讨论用元数据自建音乐 App、分析音乐趋势(例如某些子类型意外受欢迎)。
    • 部分人分享自身囤积规模(有人有数 PB 数据),并呼吁大家 seeding(做种)帮助保存。
  • 担忧与批评

    • 法律风险:预测音乐产业(RIAA 等)会强烈反击,可能导致 Anna's Archive 被封锁、域名下架,或 ISP 封锁(德国已有先例)。但因开源和分散式 torrent,有人乐观认为难以彻底消灭。
    • 质量与完整性:批评只刮热门歌,忽略稀有/小众音乐;音质非无损,有人建议从 Qobuz/Tidal 抓 FLAC 更好。
    • 实用性:300TB 太大,普通人存不起;更适合 AI 训练或大规模镜像,而非个人听歌。
    • 其他:幽默讨论(如“音乐产业要跟俄罗斯开战了”,Anna's Archive 据传在俄罗斯较安全);担心 Spotify 加强防护影响正常使用。
  • 整体氛围:参与度很高(8000+ 赞、600+ 评论),DataHoarder 社区大多支持保存精神,但也理性讨论成本、风险和替代方案(如私人 tracker Redacted.ch 的无损音乐)。

总之,这件事被视为音乐数字保存的里程碑,但也引发版权、质量和可持续性的激烈争论。目前元数据已可下载,音乐文件正在陆续释放中,Spotify 正在调查。

Lovable.dev 提供了一种基于 AI 的全新网站和应用构建方式,可以通过自然语言对话来快速创建、修改或定制你的网页或应用。你可以利用这个平台进行 UI 修改、功能开发 等多种任务。

LOVABLE AI 免费获取2个月pro账号

注册,然后在支付的优惠码输入 NEXTPLAY-LOV-25

就可以获取2个月免费 pro账号 支付时候用一个虚拟卡支付就可以了.免费0额度都可以.

LOVABLE AI 免费获取2个月pro账号

hpcbristol.net 网站介绍

hpcbristol.net 是 Historical Photographs of China(中国历史照片)项目的官方网站。该项目由英国布里斯托大学(University of Bristol)历史系于2006年至2021年主持,主要目的是收集、数字化并在线公开保存在中国境外(多为私人收藏)的近代中国历史照片。这些照片大多来自外国人在华家庭或后代的手中,涵盖了超过一个世纪的近代中国历史(约从19世纪中叶到20世纪中叶),包括各种地方、社区和社会主题。

  • 收藏规模:目前网站上有超过21,000张数字化照片,分为98个收藏集(部分大型收藏有详细介绍,小型收藏归入“杂集”)。
  • 内容特点:照片记录了城市与乡村生活、建筑、风俗、公共事件等,许多是珍贵的历史记录(因为20世纪中国动荡,许多本土照片资料已丢失)。
  • 功能:支持搜索、标签浏览、“Lucky Dip”(随机查看照片),照片可放大查看,并以Creative Commons许可开放用于教学、学习和研究。
  • 合作与支持:项目得到多家机构资助(如英国学术基金会、蒋经国基金会),并与中国上海交通大学合作设有镜像站点。
  • 相关博客:visualisingchina.net 是该项目的更新博客,分享照片故事和历史解读。

这是一个学术性强、免费开放的优质资源,非常适合研究近代中国视觉历史。

类似网站推荐(专注于中国历史图片的收藏或档案)

以下是一些与 hpcbristol.net 类似的专业历史照片档案网站,主要收集近代(晚清至民国时期)中国照片,许多也来自西方摄影师或传教士视角。它们多为大学或机构主办,免费浏览(部分需注册或有使用限制):

  1. Sidney D. Gamble Photographs(杜克大学收藏)

    • 网址:https://library.duke.edu/digitalcollections/gamble/ 或相关搜索入口。
    • 美国社会学家Sidney Gamble于1908-1932年间四次访华拍摄的5000多张照片,记录城乡生活、公共事件、建筑、宗教等。高质量黑白照片,许多未出版过。
  2. Virtual Shanghai(虚拟上海)

    • 网址:https://www.virtualshanghai.net/
    • 专注于上海历史照片、地图和文档(19世纪末至20世纪中叶),包含数千张老照片,支持互动地图浏览。
  3. Thomas H. Hahn Docu-Images(中国摄影史图片库)

    • 网址:搜索 "Thomas H. Hahn Historical Photographs of China"。
    • 个人学者收藏的近代中国照片档案,覆盖多个地区。
  4. Rare Historical Photos - China Category

  5. 天下老照片网(中文网站)

    • 网址:http://www.laozhaopian5.com/
    • 中国本土专业老照片分享平台,收藏大量国内外历史照片、地图和影像资料,包括淞沪会战、九一八事变等事件照片大全。资源丰富,适合中文用户。
  6. 美国国会图书馆 Prints & Photographs Online Catalog(搜索 "China")

  7. Flickr The Commons(搜索中国相关机构贡献)

其他通用但有中国内容的:Getty Images历史收藏、Shorpy(高清晰老照片,但中国较少)。

NotebookLM 如何快速制作播客

NotebookLM(Google 的 AI 笔记工具)可以非常快速地将你的文档、笔记、PDF、网页链接或 YouTube 视频等来源转换成一个自然对话式的AI 播客(Audio Overview),由两个 AI 主持人(一男一女)讨论内容,声音非常逼真,通常 5-15 分钟。

步骤:

  1. 访问 https://notebooklm.google.com/,用 Google 账号登录。
  2. 创建一个新 Notebook。
  3. 添加来源:上传 PDF/文档、粘贴文本、输入网址,或添加 YouTube 链接。
  4. 在右侧的 Notebook guide 面板中,找到 Audio Overview 部分。
  5. (可选)点击 Customize,输入指令如“重点讨论 XX 部分”或“用幽默风格讨论”。
  6. 点击 Generate,等待几分钟生成。
  7. 生成后,可以播放、调整速度、下载音频文件(WAV 格式,在播放器右上角菜单点击 Download)。
  8. 如果不满意,删除后重新生成。

这个过程通常只需几分钟,就能得到高质量的播客音频。支持多语言生成(50+ 种),但主持人对话默认英语。

如何基于 NotebookLM 播客制作短视频(Shorts/Reels)和长视频

下载音频后,用 Python 工具将音频转换成视频:添加背景图片/视频、自动字幕、波形动画等。适合 YouTube Shorts、TikTok、Instagram Reels(竖版 9:16)或长视频(横版)。

核心工具:MoviePy(Python 视频编辑库)

  • MoviePy 是最成熟的开源库,基于 FFmpeg,专用于从音频+图片生成视频、添加字幕。
  • 安装:pip install moviepy(会自动处理 FFmpeg)。

基本思路生成视频

  1. 准备材料

    • NotebookLM 下载的音频文件(.wav 或转 .mp3)。
    • 背景:静态图片(一张封面图)或动态背景视频(从 Pexels/Unsplash 下载免费 stock video)。
    • (可选)字幕:先用 Whisper 转录音频生成 SRT 字幕。
  2. 生成字幕(推荐 faster-whisper)

    • 用 OpenAI Whisper 或 faster-whisper 自动转录音频,生成带时间戳的 SRT 文件。
  3. 用 MoviePy 合成视频

    • 简单静态背景 + 音频 + 字幕:适合长播客视频。
    • 动态背景 + 剪辑音频片段:适合短视频。

完整 Python 思路示例代码(从音频生成视频)

from moviepy.editor import AudioFileClip, ImageClip, VideoFileClip, CompositeVideoClip, TextClip, ColorClip
from moviepy.video.tools.subtitles import SubtitlesClip

# 1. 加载音频
audio = AudioFileClip("podcast_audio.wav")  # NotebookLM 下载的音频
duration = audio.duration

# 2. 背景:静态图片(长视频)或动态视频
background = ImageClip("background.jpg").set_duration(duration).resize(height=1920)  # 竖版 Shorts: width=1080, height=1920
# 或动态背景:background = VideoFileClip("stock_background.mp4").loop(duration=duration)

# 3. 添加字幕(SRT 文件)
def generator(txt): 
    return TextClip(txt, fontsize=50, color='white', bg_color='black', size=(1080, None))

subtitles = SubtitlesClip("subtitles.srt", generator)

# 4. 合成视频
final = CompositeVideoClip([background, subtitles.set_pos(('center', 'bottom'))])
final = final.set_audio(audio)

# 5. 输出(短视频:subclip 剪辑;长视频直接写)
final.subclip(0, 60).write_videofile("short_video.mp4", fps=24, codec="libx264", audio_codec="aac")  # 60秒 Shorts
# 或全长:final.write_videofile("long_podcast_video.mp4")
  • 短视频:从长音频剪辑高光片段(手动或用 GPT 分析转录选段)。
  • 长视频:直接用全音频 + 静态/慢动背景。
  • 高级:添加波形动画(用 MoviePy 的 AudioClip.visualize)或多张图片切换。

生成字幕的辅助代码(用 faster-whisper)

from faster_whisper import WhisperModel
model = WhisperModel("large-v3")  # 或 small 更快
segments, _ = model.transcribe("podcast_audio.wav", word_timestamps=True)

with open("subtitles.srt", "w") as f:
    for i, seg in enumerate(segments):
        start = seg.start
        end = seg.end
        text = seg.text.strip()
        f.write(f"{i+1}\n{format_time(start)} --> {format_time(end)}\n{text}\n\n")

成熟的 Python GitHub 项目(综合起来制作视频并发布)

以下是高质量、活跃或实用的开源项目(越多列一些):

  1. Zulko/moviepy(最核心):视频编辑神器,从音频+图片生成视频、加字幕。几乎所有项目都依赖它。

  2. ProfessorKazarinoff/audio-to-video:专为播客设计,将 MP3 音频转 MP4 视频(静态背景),上传 YouTube。

  3. harshitsinghai77/podcast-to-video-remotion:从播客 MP3 + 字幕生成 YouTube Shorts 风格视频(虽用 Remotion,但有 Python 思路)。

  4. RayVentura/ShortGPT:全自动化短视频框架,支持播客转 Shorts/TikTok,自动脚本、语音、剪辑、上传。

  5. NisaarAgharia/AI-Shorts-Creator:用 GPT-4 分析长视频/播客,提取高光生成 Shorts(可适配音频)。

  6. Binary-Bytes/Auto-YouTube-Shorts-Maker:简单脚本自动生成 Shorts(TTS + 背景),易改成用 NotebookLM 音频。

  7. GabrielLaxy/TikTokAIVideoGenerator:AI 生成脚本、语音、字幕、背景,输出竖版视频(Shorts/Reels)。

  8. raga70/FullyAutomatedRedditVideoMakerBot:全自动生成+上传 Shorts/Reels/TikTok(可改用播客音频)。

  9. souzatharsis/podcastfy:开源替代 NotebookLM,直接生成多语言对话播客音频(可结合 MoviePy 转视频)。

  10. ccallazans/ai-video-generator:故事转 TTS + 字幕 + 视频,全自动化。

综合思路:自动化流水线

  1. 用 NotebookLM 生成并下载播客音频。
  2. 用 faster-whisper 转录生成 SRT 字幕。
  3. 用 MoviePy(或以上项目)合成视频:静态/动态背景 + 音频 + 字幕。
  4. 对于短视频:用 GPT 分析转录,选 30-60 秒高光片段,单独生成多个 Shorts。
  5. 发布:手动上传,或用 youtube-upload 等库自动化(需 API Key)。

这个流程免费(除 API 如 OpenAI/ElevenLabs 可选)、高效,几分钟一个视频。开始时用简单 MoviePy 脚本,熟练后整合 ShortGPT 等框架实现全自动。

动态字幕工具
https://www.pycaps.com/
https://github.com/francozanardi/pycaps

Python 视频编辑库,核心是 FFmpeg 包装,支持标题插入、文本叠加和音频混合。适合脚本化处理。
MoviePy
(GitHub: Zulko/moviepy)

auto-subtitle
(GitHub: m1guelpf/auto-subtitle)
自动生成并叠加字幕的工具,使用 Whisper AI 转录 + FFmpeg 叠加。

short-video-maker
(GitHub: gyoridavid/short-video-maker)
短视频生成器,支持文本转视频 + 字幕 + 音乐。