利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
curl -fsSL https://pkg.cloudflareclient.com/pubkey.gpg | sudo gpg --yes --dearmor --output /usr/share/keyrings/cloudflare-warp-archive-keyring.gpg
echo "deb [signed-by=/usr/share/keyrings/cloudflare-warp-archive-keyring.gpg] https://pkg.cloudflareclient.com/ $(lsb_release -cs) main" | sudo tee /etc/apt/sources.list.d/cloudflare-client.list
sudo apt update && sudo apt install cloudflare-warp -y
warp-cli registration new
warp-cli mode proxy
warp-cli connect
ss -lntp | grep 40000
通过本地 127.0.0.1:40000 端口发送请求
根本原因:MKV 的“大杂烩”属性与 MP4 的“严格标准”产生了剧烈冲突。
复杂的蓝光 MKV 结构:像您下载的这种带有 BluRay、DTS 标签的蓝光原盘压制版 MKV,它通常不只有“一段视频 + 一段声音”。为了原汁原味,压制组往往会在里面塞入:
多条视频流(比如主电影是第1条视频流,但文件里还嵌了一张电影海报作为第2条视频流)。
特殊的软字幕(如 PGS 图形字幕、ASS 特效字幕)。
附件数据 Data(比如为了特效字幕打包进去的几十个特殊字体文件)。
FFmpeg 的愚蠢默认行为:当我们的脚本触发大于 2GB 的“高压重编码”流程时,调用了 ffmpeg 将其转为 MP4。在没有明确指定挑哪些轨道的情况下,ffmpeg 会试图把 MKV 里的所有轨道和附件原封不动地塞进 MP4。
MP4 容器的严厉拒绝:MP4 格式的标准非常严格,它根本不支持封装 PGS 图形字幕和乱七八糟的字体附件数据!当 FFmpeg 试图强塞时,MP4 容器会直接报致命错误,导致 FFmpeg 瞬间崩溃退出。最终脚本就会判定:“视频转码处理失败,无法生成标准 MP4”。
要彻底根治这个问题,我们需要在 底层 FFmpeg 转码指令中,加入一组“强制纯净化隔离”参数,只提取我们需要的精华,丢弃所有导致报错的垃圾流。
方案细节(将在转码核心逻辑中增加以下指令):
增加 -map 0:v:0:强行规定只提取第 1 条主视频流(丢弃导致报错的海报视频流)。
增加 -map 0:a:0:强行规定只提取第 1 条主音轨(将其从 DTS 转为兼容性最好的 AAC)。
增加 -sn:彻底剔除并丢弃所有的软字幕轨(因为如果您选了要字幕,系统已经把中文字幕作为像素“硬烧录”到画面上了,留着软字幕不仅没用,还会让 MP4 报错)。
增加 -dn:彻底剔除所有的字体附件和杂项 Data 数据。
最近挖到一个超级实用的免费音效库,BBC 直接把几十年节目积累的声音素材全放出来了,地址在这里:https://sound-effects.bbcrewind.co.uk
整个库收录了将近三万条音效,分类特别细,自然声音就占了一万七千多条,其他还有交通工具、机械设备、人群、动物、脚步、日常生活等等十几个大类。每一轨都是BBC当年做广播、纪录片时现场录的,细节丰富、环境感很强,比很多专门卖素材的商业库听起来更真实、自然,不带那种刻意做出来的廉价感。
用起来特别省心。分类导航做得清楚,直接点进“自然”“城市”“室内”这些目录,就能一层一层筛。搜索框也很好使,关键词一敲,基本几秒就能找到想要的。比如要做一段雨天街头的背景,搜“rain city”就能出来各种强度、不同地面的雨声,试听完直接下载。
最喜欢的是它内置的混音功能,主页面就有“Remix”入口,可以在浏览器里拖几轨声音叠在一起,实时调音量、淡入淡出,马上就能调出完整的声景氛围。网站还放了几个官方示范,像Radio 1的主持人现场混的例子,看完就知道怎么把鸟叫、风声、远处车流叠出层次感,新手也能很快上手。
版权方面写得明明白白:个人项目、非商业用途免费下载,只要标注BBC来源就行;要是做商业项目,可以通过他们合作的Pro Sound Effects付费拿商用授权,同一套素材直接升级,一步到位,不用担心踩坑。
做视频、播客、Vlog的同学,尤其是想追求一点电影感氛围的,这个库真的能省大把时间。很多场景声——深林鸟群、体育场万人欢呼、老式蒸汽机车、军用直升机低空掠过——自己根本录不到,但这里基本都能找到,而且质量过硬。
总之,强烈推荐收藏起来,用过的都说香。需要音效的时候,先来这里转一圈,八成能解决问题。
本次开源的仓库(https://github.com/xai-org/x-algorithm)是 X 平台 For You 时间线(推荐饲料)的全新推荐算法,由 xAI 主导开源。核心变化是:彻底放弃了旧版算法中的手工艺特征(hand-engineered features)和各种人工启发式规则(heuristics),转而完全依赖 基于 Grok 模型的 Transformer(Phoenix 组件)进行端到端学习和排名。
算法整体流程:
关键点:具体数值权重未开源
与 2023 年旧版 Twitter 开源算法(twitter/the-algorithm)不同,本次 没有公开任何硬编码的数值权重或乘数(如旧版的 LikeWeight = 30、RetweetWeight = 100、Real Graph 权重 0.85 等)。官方明确表示:所有相关性由 Grok-based Transformer 直接学习,加权求和中的具体 weight_i 值属于保密部分,未在代码或文档中披露。
以下是算法中明确提及的、实际生效的权重、信号和调整因素(来自 README 和核心组件描述)。它们是当前算法中“有效”的部分,按管道阶段分类列出:
模型为每个候选推文预测以下 15 种用户行为概率(这些概率是排名的核心基础):
正面行为(赋予正权重):
负面行为(赋予负权重):
生效方式:这些概率直接决定了推文的“相关性”。正面行为概率越高,分数越高;负面行为概率越高,分数越低。
最终分数计算公式:
Final Score = Σ (weight_i × P(action_i))这些不是传统权重,但会直接决定推文是否能进入排名(相当于权重为 0 或 1):