【乘数而上 数惠三湘】“乘”风起,快“马”再加鞭

2024-05-10 08:31:51 [来源:华声在线] [编辑:欧小雷]
字体:【

编者按

数据要素如何赋能千行百业,惠及企业群众?数据要素×,将“乘”出什么?即日起,湖南日报推出《乘数而上 数惠三湘》系列报道,展示湖南在数据惠民、数据利企、数据促产等方面的生动实践。敬请关注。

华声在线全媒体记者 吴媚

投喂数据、奖惩训练……5月8日,马栏山视频文创产业园内,音视频工作者们正忙着“喂养”人工智能大模型。

从去年ChatGPT的火爆,到今年Sora的横空出世,技术革新为音视频产业发展提供了前所未有的机遇。

迎风来,乘风起。马栏山正积极抢抓人工智能大模型发展机遇,建立“云、网、算”统一服务平台,发挥“音视频数据要素+大模型”支撑融合作用,为影视内容生产“采集、编辑、播出、传输、显示”全链路的技术升级形成强大技术底座支撑。目前已累计服务上云企业216家,累计为企业节省生产成本超5000万元。

海量数据催生大模型

输入“云雾缭绕的张家界”文本后,一个云海张家界高清视频快速构建;上传一张手机拍摄的照片后,就能获得一段充满立体变幻特效的视频;打上描述词标签,便可生成相应风格的音乐……今年1月,国内首个音视频多媒体大模型“天幕”在园区发布,其文生视频、图生视频、文生音乐等能力惊艳行业。

马栏山是湖南音视频产业发展主阵地,目前,以大模型为代表的人工智能正成为马栏山“弯道超车”的新赛道。“喂养”大模型需要海量数据,马栏山底气从何而来?

“数据优势,正是马栏山大模型‘生根发芽’的沃土。”马栏山投资开发建设有限公司技术总监吕绍和介绍,依托湖南广电、长沙广电等历史积累以及新节目制作,园区拥有“安全可控、版权可溯”的音视频节目素材超过百万小时,为人工智能大模型训练与应用提供了强大数据支撑。

目前,园区通过“云网算大模型”新基建项目,正打造涵盖数据产生、处理、聚合、交易与使用的全链条数据平台。为满足大模型训练需求,园区还将建设高性能大模型训练平台,实现数算一体格局。“建成后,企业只需带着大模型算法,就能在园区的算力平台上,利用园区的音视频数据,完成大模型训练。”吕绍和说。

大模型赋能音视频产业

一条30秒的宣发视频,传统制作方式需要两三天,而在大模型算力加持下,几秒钟就能轻松搞定,同时还能根据平台用户的不同需求,制作不同款式不同风格的视频,大大提高了宣发效率。

一部短剧急于过审上架,人工审核排队,几个月等不来结果,大模型帮你几天就审核完毕。

……

“数据训练生成大模型,大模型同时反哺音视频生产,这是马栏山视频生产的最大特色。”吕绍和表示。

今年初,网络微短剧《柒两人生》在抖音播出,该剧在马栏山影视级XR虚拟影棚拍摄,是国内首部采用虚拟制作技术的网络短剧。

未来,在大模型加持下,虚拟场景拍摄更方便。取景星辰大海或戈壁雪山,无需再千里迢迢外拍,大模型助你揽天地万象。

事实上,大模型在训练数据的生产中也发挥重要作用。大模型训练需要简单明了、风格单一的语料,视频转码、分析、拆条、标注等环节,都可采用“机器+人”的方式,实现音视频训练语料的规模化生产。

“实现数据可被反复使用”

让更多数据“活”起来,数据交易不可或缺。

“今年下半年,马栏山‘中国V链’数据拟同步上架湖南大数据交易所文化专板,这将为用户购买音视频产品新添一个渠道。”湖南大数据交易所生态合作部负责人张睿介绍。

此前,园区数据交易已取得初步成果。例如,中广天择已与万兴科技、上海某企业达成数据交易合作,合同金额达数千万元。

关于数据交易模式,吕绍和有明确思路,“未来,我们将结合区块链确权、隐私计算等技术,以‘使用权交易’代替‘所有权交易’,实现数据‘可用不可见’,实现数据可被反复使用、可被多家使用、可以多次变现的可持续发展之路。”

数据要素×音视频产业,乘出的是无尽的星辰大海,马栏山正快“马”加鞭更上层楼。

(一审:龙晓龙 二审:余画 三审:石伟)

相关专题:乘数而上 数惠三湘

今日热点
焦点图