新壹科技 CEO 雷涛:AIGC 能快速构建元宇宙行业的基础设施

随着 ChatGPT 聊天机器人的大热,人工智能行业开启了半年之久的技术 狂飙 。

但是 ChatGPT 引起的科技伦理、网络安全、知识产权等系列问题同样需要关注。本期《元宇宙之约》对话了新壹科技 CEO 雷涛。作为一下科技孵化的公司,新壹科技最近推出了自己的智能 AI 内容生成平台 一帧秒创 。

在雷涛看来,大模型只是解决基础能力,真正到每一个领域应用还是需要去做自己的数据训练;基础模型需要真正去理解用户,因为用户的问题是千差万别,答案也会千差万别。

至于 AIGC 与元宇宙之间的关系,雷涛表示,AIGC 有助于元宇宙快速构建基础设施。

雷涛:新壹科技是由一下科技孵化的,在元宇宙 VR 及人工智能领域探索的实体。新壹科技的主要产品及业务涵盖了中短视频平台、VR 数字孪生技术应用与直播平台运营等。在 2021 年年底的时候,我们考虑做一个新的视频平台应用。当时 PGC、UGC 视频平台已经形成激烈竞争,同时创作者向视频平台转移;但大量创作者没有视频制作的能力,我们当时就做了一个文字直接转换成视频的产品——一帧秒创。

雷涛:一帧秒创是基于秒创 AIGC 引擎的智能 AI 内容生成平台,以文字生成视频为核心功能,为创作者和机构提供多模态生成服务,包括文字扩写、文字转语音、文生图、图文转视频等系列创作服务;通过对文案、素材、AI 语音、字幕等要素进行智能分析解构,助力创作者快速成片,实现零门槛产出视频。

AIGC 需要有丰富的数据和强大的算法,目前新壹科技在这方面的储备怎样?

雷涛:新壹科技也有涉猎大模型,当然我们的研发能力还不足以去完成一个全新的大模型开发,而是基于目前开源的大模型(比如 GPT、清华的 GLM)去做自己的垂直化训练,形成自己的大模型产品去为用户服务。

在 AIGC 应用方面,一帧秒创产品的核心功能是图文转视频,用户只需要输入一个标题,然后通过 AI 把这个视频完成。其产品逻辑在于通过文案去匹配素材,把素材拼接在一起形成视频,但前提是需要有足够多的素材量。

我们是一下科技孵化的企业,一下科技历史上拥有几十亿条视频为一帧秒创提供素材。我们对这些视频进行了深度的结构化,给它打上丰富的标签,供用户检索、匹配等,通过这样的方式来形成一个比较好的 AIGC 视频体验。

雷涛:GPT 本身只有文本能力,但可以基于它的文本能力去拓展它的应用。要实现生成视频输出的话,主要解决两个问题:一是 GPT 对镜头语音的理解,二是视频数据的处理和理解。

雷涛:其实我们本身的业务跟视频相关,之前也用了 GPT 系列模型。在我看来 GPT 模型可以为视频行业解决以下几个问题:一、视频脚本的撰写,文本撰写本身是 GPT 的一个基础能力;二、视频字幕的提取、翻译,这是基于 GPT 本身的一个应用;三、刚刚发布的 GPT-4 是多模态模型,这个多模态可理解、分析视频内容,同时做视频的推荐和搜索;四、GPT 既然能理解视频应用,也能用于视频内容的 AI 审查、过滤。

一些视频平台上电影解说、科普类、财经类快速成稿都大量运用人工智能来生成。这个最重要的影响就是提高视频的制作效率,让单个用户具备一些工作室才具备的视频制作能力,降低了视频制作的门槛。

雷涛:我们只是去匹配结果,尽量为客户匹配一些版权可以用的素材;如果用户需要将这些素材运用到商业领域的话,确实需要解决版权的问题。

据了解,ChatGPT 背后的大型语言模型的训练集最近数据截止于 2021 年底,所以任何关于 2022 年里发生的事件,它无法给出准确的答案,如何看待这个事情?

雷涛:ChatGPT 你可以把它理解成 OpenAI 的一个产品 Demo,它是向你展示能力,所以就算它的数据训练有时间线,但这不影响它的展示能力。数据不是核心问题,能力才是。模型只是提供解决基础能力,真正到每一个领域的应用还是需要去做自己的数据训练。基础模型真正要解决是怎么去理解用户的问题,因为用户的问题千差万别,答案也会千差万别。

雷涛:首先 GPT 是一个大语言模型,训练数据特别大,这意味着你如果去做一个类似的大模型,需要耗费大量的这种数据标注、算力、能源以及存储的成本,这种高成本的事情容易造成技术霸权,这是大模型天然存在的一个问题。

第三,现在 GPT-4 的知识范围覆盖很大,很多问题回答可以说井井有条,但也有一本正经的 胡说八道 现象。这就考验它的逻辑思维能力,对用户有没有产生误导性。

雷涛:存在一种可能,如果大家都倾向于去做模型的话,可能会产生类似军备竞赛,把大量的存储、算力、能源等成本都消费在上面。逻辑推理的误导性,可能让用户对很多新闻的真实性存疑,无法区分哪些是真的信息,哪些是假的信息。

雷涛:整体元宇宙行业发展可能不如预期:一是 VR 终端销售疲软,META 的 Quest 和字节的 Pico4 出货量都不及预期;二是与元宇宙相关的 NFT 概念有极大的投机性;此外,元宇宙行业尚未出现杀手级应用,不管是手机端、还是 VR 设备端都没有出现这样的产品。

从广义上来,AIGC 也是元宇宙的一部分,也许未来下一次技术浪潮来临的时候,元宇宙又会焕发新机,但目前来讲还是偏概念阶段。

雷涛:AIGC 这个概念从去年开始逐渐火起来,我们看到 AIGC 可以生成文本、图片、视频、代码、游戏等。

元宇宙需要大量的内容生产。如果是靠传统的 PGC 或者 UGC 方式,要么生产成本过高,要么就是生产质量偏低。AIGC 这种方式有助于元宇宙快速构建基础设施,包括文字、语音、视频等多媒体内容。

此外,元宇宙可以通过 AI 来生成代码或者 AI 来生成里面的人物,这个也是 AIGC 未来可能达到的一个方向。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注