【智算万物·湘约未来——算出新质生产力】AI来帮忙创意视频一键直出

2024-09-22 08:06:41 [来源:华声在线] [作者:谢卓芳] [编辑:刘茜]

字体:【大中小】

华声在线全媒体记者谢卓芳

输入简单的指令：“热带雨林，一头狮子正凝视着前方”。几分钟后，一段逼真的视频素材自动生成。画面中，狮子的毛发随风摆动，周围的环境栩栩如生，宛若摄影师实景拍摄。

这是国内首个音视频多媒体大模型——万兴天幕音视频多媒体大模型，也是湖南首批通过备案的大模型。以音视频生成式AI技术为基础，集视频大模型、音频大模型、图片大模型、语言大模型于一体，具备文生视频、视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等核心能力。

“天幕聚焦音视频创作全链路，让创作者在各环节都可以提高效率。”万兴科技集团股份有限公司产品策划经理罗杨介绍，音视频创作整体链路长，覆盖内容构思、资源搜索、效果编辑、效果生成、合成、编辑等流程。天幕大模型希望把音视频创作的每一个应用场景都做精，在每个环节都为用户解决实际问题。

以铺设视频字幕为例。以往视频粗剪工作量繁多，需要反复查阅素材、逐句对应裁剪。但AI算法可将视频声音自动转成文本，并匹配对应语句，让用户可以像编辑文本一样高效剪辑视频。

有数据显示，使用常规方法，制作1个3分钟以内的短视频，平均需要花费1.6个小时。记者利用天幕大模型，从创意灵感、素材生成、文本字幕、特效和音乐合成，仅花费20分钟，就制作出一个2分钟的短视频，效率指数级上升。

天幕大模型的落地同样迅速，广泛探索传媒影视、自媒体创作、电商运营、教育培训等领域的应用。

比如电商出海，服装模特需要不同年龄和不同肤色，利用天幕可迅速生成一批虚拟模特，为下游用户省去大量拍摄时间和成本;短剧赛道正热，天幕大模型可以将剧集一键翻译成多种语言，演员的口型也会相应发生变化，提升观众观看体验。

短视频风头正盛，未来天幕大模型还将从哪些方面优化?据介绍，万兴科技将重点进行AI提效增强功能的持续叠加。譬如在效率层面，如何将过往繁琐的操作通过“一键化”的方式去处理完成;在质量方面，如何能基于用户已有素材，提升其画质、音质甚至于成片的观感等，这些都已被纳入企业研发计划。

万兴科技于2019年正式落户长沙，近年来不断加大投入，目前在湘团队规模近1000人。

（一审：罗江龙二审：刘乐三审：石伟）

【智算万物·湘约未来——算出新质生产力】AI来帮忙 创意视频一键直出