为此,网络首先将视在空间,然后使用压缩的视频数据来生成。这样可以减少输入信息,有效降低架构带来的计算压力。这样一来,大部分问题就解决了。已成功将视频模型集成到其大语言模型范式中,并取得了巨大的成就过去的成功,所以很难很好地考虑效果。
另外,的训练路线选择也略有不同。他们选择了“原始大小和时长训练”,而不是业界常用的“在 波兰电报数据 训练前将视频切割成预设的标准富人电话号码列表大小和时长”的方法。这样的训练给带来很多好处①生成的视频可以更好的自定义时长②生成的视频可以更好的自定义视频大小③视频会有更好的取景和构图前两点很容易理解。
三点我举了一个例子。他们进行了模型比较裁剪尺寸视频训练和原始尺寸视频训练。左侧是模型在裁剪尺寸的视频上训练后生成的视频。右侧是模型在原始尺寸视频上训练后生成的视频。另外,对于文胜视频来说可以更好地了解用户的意图,从而达到更好的生成效果。
我还为模型添加了一些独创性。首先,训练像这样的文声视频模型需要大量包含文本描述的视频素材,因此使用了自己的·的-功能来添加高质量的文本描述基本上,只使用文章中必要的玩《使命召唤》会带来容,并记住引用时遵循语法。选择报价模板,单击+按钮,在搜索框中键入,然后在项目框中出现时选择使命召唤。
|