首页 » 软件开发 » 「新壹科技」想打造AIGC时代的超级视频应用(视频生成科技用户模型)

「新壹科技」想打造AIGC时代的超级视频应用(视频生成科技用户模型)

南宫静远 2024-07-25 02:47:48 0

扫一扫用手机浏览

文章目录 [+]

编辑|王与桐

移动互联网时代,短视频社交媒体平台的兴起,验证了技术驱动下,内容创作门槛降低、生产力提升带来价值创造的巨大潜力。

当下,有了生成式AI技术助力,内容生产模式再次变革的帷幕正徐徐拉开。
在AIGC时代,“AI+视频”的组合,能否复制上个十年的成功故事?又能否碰撞出新的火花?

「新壹科技」想打造AIGC时代的超级视频应用(视频生成科技用户模型) 软件开发
(图片来自网络侵删)

36氪近期接触到的「新壹科技」,就聚焦在AI视频生成领域。
公司成立于2021年,由「一下科技」孵化。
依托人工智能技术,新壹科技主要面向C端内容创作者,以及B端、G端客户提供系列AIGC视频应用及服务。

一下科技是在移动互联网时代,最早抓住短视频机遇的企业之一,推出了日播放量曾高达26.5亿的「秒拍视频」,以及日活曾高达500万的「小咖秀」等系列产品。
新壹科技CEO雷涛介绍,公司的创始团队也早在2020年底,就将研发重心转向AIGC视频生成领域,定位也从专注移动视频应用的公司,转向以视频为核心应用场景的人工智能公司。

回顾过去十年,雷涛认为,短视频社交媒体成功的核心逻辑在于“技术赋能下,产品更好地满足了创作者的创作需求”。

关于AIGC时代,AI+视频应用的成长路径,雷涛告诉36氪:“从打磨好产品的工具属性,获得初始用户,到逐步赋予其观看属性、社交属性,这条路径仍然适用。
”但是,在他看来,目前AIGC还处于非常早期的阶段,AI+视频应用更多呈现工具属性特征,难以预判下一阶段何时到来。

因此,新壹科技将“把AI做成视频领域生产力工具”作为新的定位下,公司要达成的首要目标。
为此,公司主要做了两方面调整:一是基于新定位,调整了组织架构,不再按做视频应用的逻辑划分部门;二是,在原有AI技术能力基础上,重新搭建AI视频生成的技术底座。

“新壹科技的创始团队经历了视频应用从PGC到UGC的整个过程。
我们内部早在2020年就达成共识,认为视频领域向后发展,会朝AI生成的方向走。
”新壹科技研发副总裁、AI项目负责人陈鹏向36氪表示,在2020年底之前,公司的AI技术研发主要为视频应用打配合,专注内容推荐算法,以及服务安审团队。

在此之后,新壹科技一方面,抽象出了视频识别、文本处理等方面沉淀的技术方案;另一方面,调研了市面上所有相关AI模型,并选择了适配的新一代文本、图像生成等开源模型,对其进行训练调优。

据介绍,公司已结合自研AI模型和训练调优后的开源模型,开发了「新壹」视频大模型,可同时处理文本、音频、视频、图像多种输入模态。
基于此,新壹科技建立了多模型调度的AIGC智能引擎「秒创」,支持通过意图分析,任务拆解,模型选择等中控流程,完成多模态AIGC内容生成任务处理。

产品/服务层面,围绕上述AI技术底座,新壹科技构建了「秒创」智能内容生成平台、「千心」智能助手、「新壹」数字人平台等产品矩阵。
同时,面向B端、G端,公司可以提供覆盖行业垂直模型训练、AI视频内容定制、2D/3D数字人等在内的综合解决方案。
另外,雷涛透露,一款具备微社交属性的AIGC视频应用即将上线。

「一帧秒创」是新壹科技现阶段的主推产品之一,于2022年10月开放测试,并在今年3月正式上线运营,主要面向内容创作者和B端客户提供文本帮写、文字转语音、文生图、图文转视频等AI内容生成服务。

“相较于移动互联网时代的视频应用,一帧秒创进一步降低了用户内容创作的门槛,提升了创作效率。
”雷涛向36氪介绍,产品满足小白用户上手使用的三个条件:

一是,用户可以使用文本帮写服务,完成视频文案撰写和脚本生成;

二是,消除了传统剪辑软件的时间轴概念,采用填空式视频制作方式,通过对文案、素材、AI语音、字幕等智能分析,在自动生成视频时间轴、完成视频素材匹配,能够满足用户的一键成片需求;

三是,2D数字人可以代替创作者出镜。
雷涛表示,目前2D数字人制作成本也已降低到专业用户可接受的水平。

在这一视频生成模式下,视频素材质量和匹配精确度是关键。
为此,新壹科技从过往积累的来自微博/秒拍、合作版权商以及公开来源的数十亿量级视频数据,提炼出千万量级的高质量结构化数据,搭建了视频素材库。
素材提炼和后续素材匹配过程主要由公司自研的场景级、镜头级视频拆分、匹配算法和模型完成。

但同时,雷涛坦言,由于创作本身的自由度较高,不同创作者对同样的文本也会有不同的素材匹配需求,难以做到完全适配。
他表示,对视频质量和个性化要求高的客户,也可选择自有素材替换。

另外,为了丰富素材替换选项,新壹科技一方面正在打造激励机制,鼓励专业用户建立、分享自己的私有素材库;另一方面,基于对Stable Diffusion训练调优的模型向用户提供生成图像替换功能。
同时,公司正跟进「Runway」的Gen2等视频生成模型的发展。
雷涛认为,完全由机器生成视频素材尚需时日。

目前,一帧秒创已累计服务于200万+内容创作者,并实现了一定规模的营收水平。
雷涛表示,前期用户除了公众号作者、头条号作者等C端专业用户和营销、传媒类小B客户,还包括视频小白用户。
另外,公司已陆续开始与金融、医疗、文旅等多个行业的大型企业客户展开合作。

付费模式方面,一帧秒创主要采用按时长收费逻辑,面向C端用户收取会员订阅+额外时长和特色素材使用费,面向B端用户的额外收费主要产生于定制化服务。

谈及竞争,雷涛告诉36氪:“目前海外类似的创新产品很多,比如Runway、Adobe Firefly等。
国内的百度、字节也在跟进相关赛道。
”但在他看来,一方面,整体来讲海外产品还比较碎片化,集成度不够高。
新壹科技旨在服务用户视频创作,功能覆盖面相对成熟,剪辑只是其中一环;另一方面,各家的切入点不同,比如百度是从自研模型切入,新壹科技更侧重应用层。
另外,相较其他同类产品,一帧秒创定位更偏向于不会剪辑,甚至不会写视频脚本的普通用户。

先跑能否一定能赢?对这个问题,雷涛坦言:“不跑肯定赢不了。
现在重要的不是考虑10年后怎么‘一览众山小’,想也没用,而是要踏实走好当下的每一步。
”他表示,新壹科技现阶段的重点是做好产品工程化,一是素材库迭代,二是算法优化,同时跟紧先进技术发展动态,在此基础上逐步拓宽视频AIGC的应用场景,如偏向娱乐、社交的场景,把视频AIGC的能力交付给更多普通用户。

标签:

相关文章

语言中的借用,文化交融的桥梁

自古以来,人类社会的交流与发展离不开语言的传播。在漫长的历史长河中,各民族、各地区之间的文化相互碰撞、交融,产生了许多独特的语言现...

软件开发 2025-01-01 阅读1 评论0

机顶盒协议,守护数字生活的新卫士

随着科技的飞速发展,数字家庭逐渐走进千家万户。在这个时代,机顶盒成为了连接我们与丰富多彩的数字世界的重要桥梁。而机顶盒协议,作为保...

软件开发 2025-01-01 阅读1 评论0

语言基础在现代社会的重要性及方法步骤

语言是人类沟通的桥梁,是社会发展的基础。语言基础作为语言学习的基石,对于个人、社会乃至国家的发展具有重要意义。本文将从语言基础在现...

软件开发 2025-01-01 阅读2 评论0

粤语电影,传承文化,点亮时代之光

粤语电影,作为中国电影产业的一朵奇葩,以其独特的地域特色、丰富的文化内涵和鲜明的艺术风格,赢得了广大观众的喜爱。本文将从粤语电影的...

软件开发 2025-01-01 阅读3 评论0

苹果游戏语言,塑造未来娱乐体验的基石

随着科技的飞速发展,游戏产业逐渐成为全球娱乐市场的重要支柱。在我国,游戏产业更是蓬勃发展,吸引了无数玩家和投资者的目光。而在这其中...

软件开发 2025-01-01 阅读1 评论0