标签 博客 下的文章

NotebookLM 如何快速制作播客

NotebookLM(Google 的 AI 笔记工具)可以非常快速地将你的文档、笔记、PDF、网页链接或 YouTube 视频等来源转换成一个自然对话式的AI 播客(Audio Overview),由两个 AI 主持人(一男一女)讨论内容,声音非常逼真,通常 5-15 分钟。

步骤:

  1. 访问 https://notebooklm.google.com/,用 Google 账号登录。
  2. 创建一个新 Notebook。
  3. 添加来源:上传 PDF/文档、粘贴文本、输入网址,或添加 YouTube 链接。
  4. 在右侧的 Notebook guide 面板中,找到 Audio Overview 部分。
  5. (可选)点击 Customize,输入指令如“重点讨论 XX 部分”或“用幽默风格讨论”。
  6. 点击 Generate,等待几分钟生成。
  7. 生成后,可以播放、调整速度、下载音频文件(WAV 格式,在播放器右上角菜单点击 Download)。
  8. 如果不满意,删除后重新生成。

这个过程通常只需几分钟,就能得到高质量的播客音频。支持多语言生成(50+ 种),但主持人对话默认英语。

如何基于 NotebookLM 播客制作短视频(Shorts/Reels)和长视频

下载音频后,用 Python 工具将音频转换成视频:添加背景图片/视频、自动字幕、波形动画等。适合 YouTube Shorts、TikTok、Instagram Reels(竖版 9:16)或长视频(横版)。

核心工具:MoviePy(Python 视频编辑库)

  • MoviePy 是最成熟的开源库,基于 FFmpeg,专用于从音频+图片生成视频、添加字幕。
  • 安装:pip install moviepy(会自动处理 FFmpeg)。

基本思路生成视频

  1. 准备材料

    • NotebookLM 下载的音频文件(.wav 或转 .mp3)。
    • 背景:静态图片(一张封面图)或动态背景视频(从 Pexels/Unsplash 下载免费 stock video)。
    • (可选)字幕:先用 Whisper 转录音频生成 SRT 字幕。
  2. 生成字幕(推荐 faster-whisper)

    • 用 OpenAI Whisper 或 faster-whisper 自动转录音频,生成带时间戳的 SRT 文件。
  3. 用 MoviePy 合成视频

    • 简单静态背景 + 音频 + 字幕:适合长播客视频。
    • 动态背景 + 剪辑音频片段:适合短视频。

完整 Python 思路示例代码(从音频生成视频)

from moviepy.editor import AudioFileClip, ImageClip, VideoFileClip, CompositeVideoClip, TextClip, ColorClip
from moviepy.video.tools.subtitles import SubtitlesClip

# 1. 加载音频
audio = AudioFileClip("podcast_audio.wav")  # NotebookLM 下载的音频
duration = audio.duration

# 2. 背景:静态图片(长视频)或动态视频
background = ImageClip("background.jpg").set_duration(duration).resize(height=1920)  # 竖版 Shorts: width=1080, height=1920
# 或动态背景:background = VideoFileClip("stock_background.mp4").loop(duration=duration)

# 3. 添加字幕(SRT 文件)
def generator(txt): 
    return TextClip(txt, fontsize=50, color='white', bg_color='black', size=(1080, None))

subtitles = SubtitlesClip("subtitles.srt", generator)

# 4. 合成视频
final = CompositeVideoClip([background, subtitles.set_pos(('center', 'bottom'))])
final = final.set_audio(audio)

# 5. 输出(短视频:subclip 剪辑;长视频直接写)
final.subclip(0, 60).write_videofile("short_video.mp4", fps=24, codec="libx264", audio_codec="aac")  # 60秒 Shorts
# 或全长:final.write_videofile("long_podcast_video.mp4")
  • 短视频:从长音频剪辑高光片段(手动或用 GPT 分析转录选段)。
  • 长视频:直接用全音频 + 静态/慢动背景。
  • 高级:添加波形动画(用 MoviePy 的 AudioClip.visualize)或多张图片切换。

生成字幕的辅助代码(用 faster-whisper)

from faster_whisper import WhisperModel
model = WhisperModel("large-v3")  # 或 small 更快
segments, _ = model.transcribe("podcast_audio.wav", word_timestamps=True)

with open("subtitles.srt", "w") as f:
    for i, seg in enumerate(segments):
        start = seg.start
        end = seg.end
        text = seg.text.strip()
        f.write(f"{i+1}\n{format_time(start)} --> {format_time(end)}\n{text}\n\n")

成熟的 Python GitHub 项目(综合起来制作视频并发布)

以下是高质量、活跃或实用的开源项目(越多列一些):

  1. Zulko/moviepy(最核心):视频编辑神器,从音频+图片生成视频、加字幕。几乎所有项目都依赖它。

  2. ProfessorKazarinoff/audio-to-video:专为播客设计,将 MP3 音频转 MP4 视频(静态背景),上传 YouTube。

  3. harshitsinghai77/podcast-to-video-remotion:从播客 MP3 + 字幕生成 YouTube Shorts 风格视频(虽用 Remotion,但有 Python 思路)。

  4. RayVentura/ShortGPT:全自动化短视频框架,支持播客转 Shorts/TikTok,自动脚本、语音、剪辑、上传。

  5. NisaarAgharia/AI-Shorts-Creator:用 GPT-4 分析长视频/播客,提取高光生成 Shorts(可适配音频)。

  6. Binary-Bytes/Auto-YouTube-Shorts-Maker:简单脚本自动生成 Shorts(TTS + 背景),易改成用 NotebookLM 音频。

  7. GabrielLaxy/TikTokAIVideoGenerator:AI 生成脚本、语音、字幕、背景,输出竖版视频(Shorts/Reels)。

  8. raga70/FullyAutomatedRedditVideoMakerBot:全自动生成+上传 Shorts/Reels/TikTok(可改用播客音频)。

  9. souzatharsis/podcastfy:开源替代 NotebookLM,直接生成多语言对话播客音频(可结合 MoviePy 转视频)。

  10. ccallazans/ai-video-generator:故事转 TTS + 字幕 + 视频,全自动化。

综合思路:自动化流水线

  1. 用 NotebookLM 生成并下载播客音频。
  2. 用 faster-whisper 转录生成 SRT 字幕。
  3. 用 MoviePy(或以上项目)合成视频:静态/动态背景 + 音频 + 字幕。
  4. 对于短视频:用 GPT 分析转录,选 30-60 秒高光片段,单独生成多个 Shorts。
  5. 发布:手动上传,或用 youtube-upload 等库自动化(需 API Key)。

这个流程免费(除 API 如 OpenAI/ElevenLabs 可选)、高效,几分钟一个视频。开始时用简单 MoviePy 脚本,熟练后整合 ShortGPT 等框架实现全自动。