VideoTranscriptionWhisperSubtitle
用大模型实现视频字幕生成与内容理解
结合 Whisper API 和 ChinaWHAPI 的语言模型,实现视频字幕生成、内容摘要和问答。
工作流程
视频 → 语音转文字(Whisper)→ 字幕处理(大模型)→ 内容理解(大模型)。
字幕生成
用 Whisper 将视频音频转为文字,再用 Qwen3.6 Plus 做标点修复、分段和术语标准化,生成可读性更高的字幕。
内容摘要
{"model":"qwen3.6-plus","messages":[{"role":"user","content":"请将以下字幕内容整理成时间线摘要,标注每个时间点的关键内容:\n{transcript}"}]}视频问答
将视频字幕作为上下文,用户提问时检索相关字幕段落,再由模型生成答案。适合长视频的知识提取和问答。