分类 实用工具 下的文章

Gemini-Subtitle-Pro 是一款一站式全自动字幕生成工具,使用 Google Gemini AI 和 OpenAI Whisper 等模型,实现从视频下载到字幕压制的完整流程,无需人工干预。主要功能包括:

  • 全自动流程:支持从视频链接自动下载、语音转写、翻译、时间轴对齐、字幕压制导出。
  • 视频下载:支持 YouTube(包括 Shorts)和 Bilibili(BV 号、分 P)视频下载(桌面版专有)。
  • 语音转写:使用 Whisper 模型(支持本地离线模型 whisper.cpp 或在线 OpenAI API),实现高精度语音识别。
  • 翻译与润色:使用 Gemini 模型(Gemini 1.5 Flash、1.5 Pro、2.0 Flash 等)进行高质量翻译,支持长上下文分段处理。
  • 精准时间轴对齐:毫秒级字符同步,支持强制对齐,实现字幕与音频/视频精确匹配。
  • 智能后处理:自动断句、时间轴校正、术语自动提取与替换(通过 Google Search 验证标准译法)、说话人识别与标注。
  • 字幕预览与渲染:实时所见即所得预览,支持 ASS 样式(字体、颜色、位置等)。
  • 视频压制:内置 FFmpeg,支持 H.264/H.265 编码,双语 SRT/ASS 格式导出。
  • 性能优化:智能并发处理、GPU 加速(NVIDIA 显卡可提升 Whisper 速度 5-10 倍),30 分钟视频约 8-10 分钟完成。
  • 其他:缓存管理、自定义 API、版本快照等。

整体适合影视字幕制作、听障辅助、专业配音等高精度需求。

如何使用(详细步骤)

项目主要提供 Windows 桌面便携版,使用非常简单,以下是完整步骤:

  1. 下载程序

  2. 安装与启动

    • 解压 ZIP 文件到任意文件夹。
    • 双击 Gemini Subtitle Pro.exe 启动程序(无需安装)。
  3. 配置 API Key(必须)

    • 打开程序后,进入“设置”页面。
    • 填写 Gemini API Key(推荐使用支持 Gemini 1.5/2.0 模型的公益站或官方 Key)。
    • 填写 OpenAI API Key(用于在线 Whisper 转写,可选)。
    • 保存配置。
  4. 可选:启用本地离线 Whisper 转写(推荐,避免 API 费用):

    • 从 Hugging Face 下载 GGML 模型(如 ggml-base.binggml-small.bin):https://huggingface.co/ggerganov/whisper.cpp/tree/main
    • 在设置 → 常规 → 选择“使用本地 Whisper”。
    • 点击“浏览”选择下载的 .bin 模型文件。
    • 保存(推荐 ggml-small.bin 或更高以获得更好质量)。
  5. 可选:启用 GPU 加速(NVIDIA 显卡)

    • 从 whisper.cpp Releases 下载 GPU 版(如 whisper-cublas-bin-x64.zip):https://github.com/ggerganov/whisper.cpp/releases
    • 解压得到 whisper-cli.exe 和相关 DLL 文件。
    • 将这些文件放入程序主目录或 resources/ 文件夹。
    • 重启程序,即可自动使用 GPU 加速。
  6. 可选:启用高精度时间轴强制对齐(实现毫秒级字符同步):

    • 从项目 Releases 下载 aligner-windows-x64.zip,解压得到 align.exe
    • 从 Hugging Face 下载对齐模型:https://huggingface.co/MahmoudAshraf/mms-300m-1130-forced-aligner
    • 在设置中选择“强制对齐”。
    • 设置“执行文件”为 align.exe 路径。
    • 设置“模型路径”为下载的模型文件夹。
    • 保存启用。
  7. 开始生成字幕

    • 在主界面输入视频文件路径或支持的视频链接(YouTube/Bilibili)。
    • 配置目标语言、翻译模型、输出格式等参数。
    • 点击开始处理,程序会自动完成下载 → 转写 → 翻译 → 对齐 → 压制全流程。
    • 处理完成后,可实时预览字幕效果,并导出 SRT/ASS 文件或压制视频。

注意事项

  • 不支持播放列表、直播、付费内容下载。
  • 处理长视频时建议使用本地 Whisper + GPU 以提升速度和降低成本。

部署方式

  • 是否只能本地部署:是的,主要设计为本地桌面应用(Windows 便携版),依赖 Electron + Node.js 图形界面和本地资源文件(如 whisper-cli.exe、align.exe),适合个人电脑本地运行。
  • 是否可以在 VPS Linux 上部署使用不支持。项目没有提供 Linux 版本或服务器端部署方式,无法在无图形界面的 Linux VPS 上运行(缺少 GUI 支持和 Windows 专用的可执行文件)。即使通过源码构建,也仅生成 Windows 桌面包,不适用于 Linux 服务器环境。

如果需要在 Linux 上实现类似功能,建议寻找其他开源项目(如基于 Python 的 Whisper + Gemini 脚本工具),但本项目不直接支持。

Easy-Vibe 项目详细介绍

Easy-Vibe 是 Datawhale(一个开源学习社区)推出的一个项目制学习教程仓库,全称“从 0 到 1 学会 vibe coding,项目制学习”。它的核心目标是帮助学习者从零基础开始,掌握 vibe coding(一种 AI 辅助的、直觉式的现代编程方式),最终能够独立构建完整的 AI 原生应用(AI-native products)并上线部署。

这是用来做什么的?

  • 解决的问题

    • 很多人不知道如何选择和使用 AI 编程工具(比如 Claude、Cursor、Trae 等)。
    • 不知道如何将大模型的能力(如生成代码、图像、视频)应用到实际产品中。
    • 不清楚 AI 生成的代码距离真实上线运行还有多大差距。
  • 核心理念:通过“vibe coding”方式(用自然语言提示 AI 生成、迭代代码),结合项目实践,让学习者快速从想法原型到生产级产品。
  • 学习路径:分为三个阶段:

    1. 本地原型阶段:构建简单的 Web 小应用(如贪吃蛇游戏)。
    2. 全栈开发与部署阶段:集成后端、数据库、RAG(检索增强生成),并上线部署。
    3. 跨平台复杂应用阶段:开发更高级的 AI 应用(如霍格沃茨肖像生成器)。
  • 目标受众

    • 非技术小白(但建议有基本编程基础)。
    • 中级开发者想快速原型化。
    • 高级工程师想高效构建 AI 产品。
  • 额外收获:不仅仅教编码,还强调产品思维(如需求文档 PRD 编写、UI/UX 设计、用户增长策略、想法验证)。

项目通过一系列递进的实战项目(如贪吃蛇游戏、霍格沃茨肖像应用、现代 Web App)来教学,帮助你掌握从想法到上线的全流程。

主要特点和技术栈

  • 特点

    • 项目驱动学习,闭环体验(建议完整做完所有项目)。
    • 强调 AI 工具链的使用,减少手动敲代码。
    • 包含额外知识补充(如 Git/GitHub 使用、API 调用等)。
  • 关键技术

    • 前端:HTML/CSS/JS、现代组件库、UI 设计工具。
    • 后端:Supabase(数据库、认证、存储、边缘函数)、Dify(RAG、工作流编排)。
    • AI 工具:Trae(推荐 AI IDE)、Cursor、VS Code、Claude 等大模型。
    • 部署:Zeabur(一键云托管)、类似 Vercel/Netlify。
    • 版本控制:Git & GitHub(分支、PR、SSH)。
    • API:文本转图像/视频、Dify API、Supabase API 等。

仓库许可:CC BY-NC-SA 4.0(知识共享、非商业、相同方式共享)。

如何使用?

  1. 准备环境

    • 安装 Node.js、npm、Git。
    • 推荐使用 AI IDE(如 Trae、Cursor 或 VS Code + AI 插件)。
    • 有基本编程知识(任意语言)最好。
  2. 克隆仓库

    git clone https://github.com/datawhalechina/easy-vibe.git
    cd easy-vibe
  3. 运行本地服务(两种方式):

    • 推荐现代方式(AI IDE)
      在 AI IDE 中打开项目文件夹,直接输入提示:

      请你帮我运行这个项目的本地服务

    AI 会自动帮你安装依赖并启动。

    • 传统 CLI 方式

      npm install
      npm run dev

      然后浏览器打开 http://localhost:3000 查看。

  4. 学习和使用流程

    • docs/ 目录开始阅读:

      • 先看 Chapter 0:学习地图docs/project/chapter0-learning-map/),了解整体路径。
      • 依次完成 Project 1~6(每个章节有详细 Markdown 教程、代码示例和 AI 提示指导)。

        • 示例项目:Project 1 用 AI 构建贪吃蛇游戏,并集成文本/图像生成 API。
        • Project 4:用 AI IDE 将设计图转为霍格沃茨肖像应用代码。
      • 额外示例(docs/examples/):如用 Trae 构建微信小程序版贪吃蛇。
    • 在实践中,多用 AI 提示生成代码、调试、优化。
    • 项目逐步引入 Git 提交、分支管理、部署到 Zeabur 等。
  5. 注意事项

    • 仓库主要文档是中文(英文文档不完整)。
    • 部分高级项目(7~9)和示例(2~3)仍在建设中(

nanobanana提示词各种模版

https://youmind.com/nano-banana-pro-prompts

例如

Create a modern Apple Design-inspired "This Day in History" calendar page for {当前月}月{当前日}日, {当前年份}, commemorating {历史事件标题} on {事件月}月{事件日}日, {事件年份}. Ultra-minimalist, clean, and sophisticated layout in 4K quality.
Layout Structure:

  • Top: Elegant Chinese date "{月}月{日}日" (large), "星期{X}" (small)
  • Calendar widget: Top-right corner showing {当前年份}年{当前月}月 calendar grid
    CRITICAL - Calendar Accuracy Requirements:
  • Display the CORRECT month: {当前年份}年{当前月}月 (e.g., "2026年1月" for January 2026)
  • Show accurate calendar grid with correct day-of-week alignment
  • Highlight date {当前日} (e.g., if today is 1月6日, highlight "6")
  • Calendar must start from the 1st day of the current month
  • Show correct number of days for the month (January = 31 days)
  • First day of month must align with correct weekday
  • Reference: January 2026 starts on Thursday (周四), so grid layout should be:
    Row 1: [empty] [empty] [empty] [1] [2] [3] [4]

Row 2: [5] [6-highlighted] [7] [8] [9] [10] [11]
etc.

  • Use accurate 2026 calendar data, do NOT use random or placeholder dates
  • Main card: Frosted glass effect with subtle shadows
    Central Illustration:

{根据领域选择对应插画场景配置}

  • Clean line-art style with limited color palette
  • {领域特定元素列表}
  • Soft ambient lighting creating depth
  • Cute minimalist cartoon character in {领域}风格 in corner
    Typography (4K clarity):
  • Category: "历史上的今天 | {领域}" - Thin sans-serif
  • Title: "{事件年份}年{事件月}月{事件日}日:{事件标题}" - Medium weight
  • Body: "{事件详细描述}" - Light weight, 1.8 line-spacing
  • Highlight keywords: {关键词列表} with subtle emphasis
    Design Elements:
  • 60% white/negative space
  • 8px grid system alignment
  • Soft shadows (0 4px 16px rgba(0,0,0,0.06))
  • {领域特定装饰图案}
  • {领域特定纹理}
    Color Scheme:
  • Background: {领域背景色} with {领域纹理}
  • Primary text: #1D1D1F
  • Accent: {领域点缀色1} and {领域点缀色2}
  • Card: rgba(255,255,255,0.96) with blur
    Watermark:
  • "{当前年份}" in English, 6% opacity, ultra-thin, diagonal background
    Apple Design Principles (4K):
  • Crystal-clear typography with perfect anti-aliasing
  • Sophisticated shadow layering
  • Minimum 32px padding
  • WCAG AAA contrast ratios
  • Perfect pixel precision
    Bottom right: "创作者: Berryxia" in subtle elegant text

Format: Portrait (9:16 or 2:3), 4K quality
Mood: Elegant, {领域情绪}, sophisticated - celebrating {领域特点} with contemporary design excellence.
VERIFICATION CHECKLIST (Must satisfy ALL):
✓ Calendar shows correct month: {当前年份}年{当前月}月
✓ Calendar grid starts from day 1 of current month
✓ Date {当前日} is highlighted correctly
✓ Days of week align correctly (consult 2026 calendar)
✓ Number of days matches actual month length

这个可用做历史今天

nanobanana提示词各种模版

NotebookLM 不支持直接将生成的分类总结或笔记输出为 DOCX 文档。它主要通过网页界面生成和显示内容,如笔记、学习指南、FAQ 或音频概述,而内置导出选项有限,通常仅支持下载为 Markdown、PDF(部分功能如 Infographic 可下载为 PNG)或分享链接。

替代方法实现类似输出

尽管没有原生 DOCX 导出,你可以通过以下方式获取内容并转换为 DOCX:

  1. 手动复制并粘贴:在 NotebookLM 的笔记或聊天响应中,生成的分类总结通常以结构化文本(如 bullet 列表或表格)呈现。你可以全选复制,然后粘贴到 Microsoft Word 或 Google Docs 中,保存为 DOCX。这会保留基本格式,但可能需要手动调整表格或方程。
  2. 使用第三方工具转换

    • 生成 Markdown 输出(NotebookLM 支持导出笔记为 Markdown),然后使用工具如 MassiveMark、Pandoc 或在线转换器(如 bibcit.com)将其转为 DOCX。这些工具能保留表格、代码和方程的格式。
    • 例如,在 NotebookLM 生成总结后,导出为 Markdown 文件,然后在 Word 中打开或使用转换服务下载 DOCX。
  3. 下载所有笔记:如果你生成多个笔记,可以使用扩展方法(如浏览器插件或脚本)一次性下载整个项目的内容,然后导入 Word。但这不是官方功能,需要额外步骤。

NotebookLM 支持上传 DOCX 文件进行分析(如你的物理题目文档),但输出侧重点在交互式笔记而非文件导出。如果需要更灵活的导出,考虑结合 Google Docs(NotebookLM 基于 Google 生态)或外部 AI 工具来处理生成的内容。

bibcit.com 在线工具注册就可以领取免费额度.

NotebookLM 结果导出DOCX 文档或者pdf文档

hpcbristol.net 网站介绍

hpcbristol.net 是 Historical Photographs of China(中国历史照片)项目的官方网站。该项目由英国布里斯托大学(University of Bristol)历史系于2006年至2021年主持,主要目的是收集、数字化并在线公开保存在中国境外(多为私人收藏)的近代中国历史照片。这些照片大多来自外国人在华家庭或后代的手中,涵盖了超过一个世纪的近代中国历史(约从19世纪中叶到20世纪中叶),包括各种地方、社区和社会主题。

  • 收藏规模:目前网站上有超过21,000张数字化照片,分为98个收藏集(部分大型收藏有详细介绍,小型收藏归入“杂集”)。
  • 内容特点:照片记录了城市与乡村生活、建筑、风俗、公共事件等,许多是珍贵的历史记录(因为20世纪中国动荡,许多本土照片资料已丢失)。
  • 功能:支持搜索、标签浏览、“Lucky Dip”(随机查看照片),照片可放大查看,并以Creative Commons许可开放用于教学、学习和研究。
  • 合作与支持:项目得到多家机构资助(如英国学术基金会、蒋经国基金会),并与中国上海交通大学合作设有镜像站点。
  • 相关博客:visualisingchina.net 是该项目的更新博客,分享照片故事和历史解读。

这是一个学术性强、免费开放的优质资源,非常适合研究近代中国视觉历史。

类似网站推荐(专注于中国历史图片的收藏或档案)

以下是一些与 hpcbristol.net 类似的专业历史照片档案网站,主要收集近代(晚清至民国时期)中国照片,许多也来自西方摄影师或传教士视角。它们多为大学或机构主办,免费浏览(部分需注册或有使用限制):

  1. Sidney D. Gamble Photographs(杜克大学收藏)

    • 网址:https://library.duke.edu/digitalcollections/gamble/ 或相关搜索入口。
    • 美国社会学家Sidney Gamble于1908-1932年间四次访华拍摄的5000多张照片,记录城乡生活、公共事件、建筑、宗教等。高质量黑白照片,许多未出版过。
  2. Virtual Shanghai(虚拟上海)

    • 网址:https://www.virtualshanghai.net/
    • 专注于上海历史照片、地图和文档(19世纪末至20世纪中叶),包含数千张老照片,支持互动地图浏览。
  3. Thomas H. Hahn Docu-Images(中国摄影史图片库)

    • 网址:搜索 "Thomas H. Hahn Historical Photographs of China"。
    • 个人学者收藏的近代中国照片档案,覆盖多个地区。
  4. Rare Historical Photos - China Category

  5. 天下老照片网(中文网站)

    • 网址:http://www.laozhaopian5.com/
    • 中国本土专业老照片分享平台,收藏大量国内外历史照片、地图和影像资料,包括淞沪会战、九一八事变等事件照片大全。资源丰富,适合中文用户。
  6. 美国国会图书馆 Prints & Photographs Online Catalog(搜索 "China")

  7. Flickr The Commons(搜索中国相关机构贡献)

其他通用但有中国内容的:Getty Images历史收藏、Shorpy(高清晰老照片,但中国较少)。