智象未来:如何打通视频模型商业化“最后一公里”?
过去一年,视频生成大模型领域竞争激烈,年初Sora引发关注,国内众多企业也纷纷推出产品。但探索商业化成为众多视频生成创业者面临的困境。
在第7届北京智源大会大模型产业CEO论坛上,智象未来创始人兼CEO梅涛坦言,大模型商业化仍不明显,离最后的商业应用还差“最后一公里”。智源研究院院长王仲远指出,原生多模态技术在文生视频、文生图方面仍处于探索期。
尽管国产大模型在多模态融合等方面取得进展,但技术上仍存在瓶颈,影响了视频生成模型商业化路径。Sand.AI创始人兼CEO曹越认为,当前主流的Diffusion模型和Transformer模型训练方案存在核心问题,即不够“Scalable”。这与2018年语言模型发展阶段类似,当时BERT模型扩大规模后性能提升停滞。在视频生成方向,这两种模型扩大参数规模也快速达到瓶颈。
梅涛指出,视频生成大模型处于ChatGPT2到ChatGPT3阶段,突破商业化瓶颈关键在于达到叙事性、稳定性和可控性。他对商业化有不同阶段的思考,2025年他希望直接把结果交付给用户,帮用户做增长并分佣。他还表示要构建完整生态,推动生态系统运转,最终可能进入电商领域构建业务闭环。
曹越认为视频生成模型在不同阶段产品契合度不同,早期虽生成效果不完美但有成本优势,预测未来三到五年该方向大有可为。