开云体育该 MV 的背后更有上万张图片-开云app下载官方网站
你的位置:开云app下载官方网站 > 新闻资讯 > 开云体育该 MV 的背后更有上万张图片-开云app下载官方网站
开云体育该 MV 的背后更有上万张图片-开云app下载官方网站
发布日期:2026-06-25 07:06    点击次数:109

视频生成大模子开云体育,能匡助我们成为视频创作家吗?

前段时辰,AI 歌手 Yuri 火爆全网,不少网友惊叹 AI 大模子生成的视频竟然真假难辨,口型和声息近乎完竣同步。全都由 AI 创作的 MV 视频《SURREAL》似乎向我们解说,每个东说念主都可以使用 AI 创作出高质料的视频,但事实确实如斯吗?

《SURREAL》的背后是史册使命室,领有专科的后期团队,该 MV 的背后更有上万张图片,无法代表民众水平。

为了考据视频生成大模子的真实才调,雷科技挑选了国内东说念主气和才调较强的可灵、即梦、清影、拍我四款视频生成模子,将通过一场评测,展现现时国产视频生成模子的才调,以及洽商哪款视频生成模子最强。

(图源:mockup 网站套壳)

这四款模子中,可灵出自快手,曾有「国产 Sora」的称呼,但上线时辰比 Sora 更早;即梦出自字节进步,可用抖音扫码登录;清影出自智谱 AI 团队,而智谱中枢成员来自国内顶级学府清华大学的 KEG(常识工程)实践室;拍我原名 PixVerse,出自重诗科技,此前主要面向国外商场,本年 6 月才推出洋内版 App。

先容完了,四款 App 实力怎么,我们看走漏话语。

先说一下测试环境,可灵遴荐了 2.1 大众版块,即梦为视频 3.0 版块,清影暂不相沿转变版块,因而使用默许版块,拍我为 V4.5 版块,生成的视频均为 16:9 比例、5 秒时长、720P 分辨率,但由于图片大小抑止,雷科技将视频制作成 GIF 时会进行压缩。

为了保证公正性,镜头畅通、格调等参数均不调度,保捏默许建设。悉数视频均生成一次,阻隔"东说念主工筛选"优秀作品或后期修改,测试共分为三轮。

第一轮《天净沙 · 秋念念》:静态画面完竣,动态可灵完胜。

若想放胆让每个东说念主都能愚弄视频生成模子挥洒创意,最艰苦的便是提高 AI 对天然语言的知道才调,而非依靠特定的辅导词,悉数视频生成大模子也都执政着这个处所发展。

因此,第一题雷科技遴荐了马致远的《天净沙 · 秋念念》,这首初中讲义上的散曲,坚信环球还能背诵下来,作家仅用一言半辞,就勾画出了一幅凄迷哀愁的暮年,能否解构作家想要抒发的境界,关于生成视频的准确性尤为艰苦。

有着「国产 Sora」之称的可灵,生成的视频大体与散曲相符,水中的波纹、落寞孤身一人的老者,以及桥上雕栏和路边草木的光影拟真进度较高,镜头的拉升突显出了冷漠感。好意思中不及的是,桥对岸肖似地说念的洞口,以及上方如同被土壤掩埋的屋子不够合营。在我看来,前列一派平原,寥寥几户东说念主家,再加上几缕炊烟,更能突显疏淡的好意思感。

(图源:可灵生成)

即梦生成的视频若不看马儿,可能会有点分不出来究竟是 AI 生成的,如故有东说念主在薄暮时拍摄的,水面的波纹、天外云彩的变化,以及远方的夕阳,接近完竣。关连词两匹马走路的姿态却有极少轮廓,导致我们发达不雅察时,能够辩认出画面由 AI 生成。最艰苦的是,这段视频枯竭了这首散曲的中枢「断肠东说念主」。

(图源:即梦生成)

清影生成的视频就有些离谱了,先不说通常枯竭「断肠东说念主」这一中枢元素,马匹走着走着竟在空中飘起来就很分歧理。清影生成的通盘画面真实度很高,卓越是河流的细节,水流冲击到河岸时会造成回流。仅仅马儿腾空而起的画面,问题实在太严重。

(图源:清影生成)

拍我生成的画面,能够体现出落寞孤身一人的境界,后头的转场令我猜测了留守儿童送父母出门打工的画面。不外这段视频东说念主物的全体装饰过于当代化,而且转场有些突兀,马儿和转场后的英文略显填塞。

(图源:拍我生成)

静态景物和动作幅度较小的动态景物,四款 AI 大模子的差距不赫然,但到畅通度较大的景物时差距立见分晓,即梦、清影的马儿步履都有些不天然。总体来说,本轮测试中,可灵走漏最佳,其次为即梦和拍我,清影生成的视频中马儿腾空而行,导致扣分严重。

第二轮《舞女谢幕》:面部、肢体均有谬误,合营性有待改良,可灵、即梦不分仲伯。

与文生视频不同,接收图生视频时,用户可以抑止环境和事物主体,便于创作邻接性较高的长视频。视频生成大模子能否完竣复刻图片的环境和事物特色,则是纯熟它们才调的要道。本轮的测试题为:舞女放胆了扮演,向台下不雅众鞠躬请安。所用的图片为豆包 AI 大模子生成,如下:

(图源:豆包 AI 生成)

可灵在评测中阐明踏实,东说念主物的动作幅度是几款大模子生成的视频中最大的,且地板的倒影和东说念主物裙摆的实质舞动一致,东说念主物全体动作还算天然。关连词右手在临了的鞠躬动作从上往下舞动时,如故出现了虚影。

即梦生成的视频动作幅度较小,鞠躬的动作也较为法式,但手指处依然有一些不合营,在从上向下出动时,手指数目似乎不对。不外即梦的走漏仍是极为出色,莫得出现赫然的谬误。

(图源:即梦生成)

上一轮测试中走漏不太出色的清影,这一轮又出现了问题,东说念主物鞠躬动作显得极为沉稳,而且在出动历程中,手臂、手指、面部都出现了扭曲变形的情况,赫然是左证东说念主物的图片生建设体动作时处理不够完善,以至于存在赫然的不合营画面。

拍我生成的视频除了辅导词面孔的舞女鞠躬,还主动将镜头向后拉,展示出了下方不雅众饱读掌的画面。问题是,东说念主物的饱读掌动作十分不合营,以至于弄巧成拙。

与上一轮评测的放胆相似,静态事物各家模子生成的视频质料相似,动态事物的处理存在赫然差距。至于手指处不合营的问题,自从 AI 能够创作图片和视频运行就一直存在,时于当天仍未被透彻搞定。

可灵天然有手臂虚影这一赫然问题,但主动给我方增多难度的转圈动作属于加分项,与即梦仍可并排第一,拍我天然也存在不雅众饱读掌时动作扭曲的问题,但肖似电影镜头的处理,也能为其加分。清影在莫得主动给我方增多难度的情况下,仍出现了手臂、手指、面部扭曲且动作较为沉稳的问题,走漏最差。

值得一提的是,四款 AI 大模子并未排斥图片的水印,比拟尊重原创,但清影用我方的水印挡住了图片的水印,处理不是太好。

第三轮《荷塘月色》:阅读知道比拼,即梦号称「高考状元」。

在讲义、试卷上,我们庸俗读到名家散文,有时还需要聚首我方的阅读知道,修起相应的问题。这一次,雷科技也给视频模子准备了沿路阅读知道,条目它们按照朱自清的散文《荷塘月色》段落生成一段视频。具体内容如下:

曲迂回折的荷塘上头,弥望的是田田的叶子。叶子出水很高,像亭亭的舞女的裙。层层的叶子中间,稀薄地点缀着些白花,有袅娜地开着的,有憨涩地打着朵儿的;正如一粒粒的明珠,又如碧天里的星星,又如刚出浴的好意思东说念主。微风过处,送来缕缕幽香,仿佛远方高楼上迷茫的歌声似的。这时候叶子与花也有一点的颤动,像闪电般,倏得传过荷塘的何处去了。叶子本是肩并肩密密地挨着,这便宛然有了沿路凝碧的波痕。叶子下面是脉脉的活水,遮住了,弗主见一些神态;而叶子却更见风骚了。

可灵生成的视频一如既往高质料,说是用手机或相机拍摄的,可能都有东说念主信,荷叶、荷花真实度极高,水面的倒影、波纹也宛如真实画面,镜头的出动更为这段视频增添了一点灵动感。好意思中不及的是,可灵可能扭曲了「像闪电般」这句话,导致画面起头部分确实有闪电划过。

即梦创作视频的质料通常踏实,荷花、荷叶随风扭捏,水中的倒影也在震荡。尽管植物茎叶在水中震荡时激起波纹的脾气,该视频没能太好地展示出来,但弗成覆盖这段视频的优秀。

至于清影生成的视频,荷叶与荷花铺满了水面,却与段落中的「叶子出水很高」不相符,也莫得体现出来波痕、活水等特色,通盘视频宛如静态,只须小幅度的变化。

若是说可灵生成的视频中掠过的闪电可以用晴空轰隆强行解释,拍我生成的画面中,从水中钻出的诡异东说念主头,只可用 「荷花修皆成精」这么的打趣来解释了。出现这种画面,可能是拍我知道错了「又如刚出浴的好意思东说念主」这句话。清影生成的画面极新唯好意思,若是莫得东说念主头从水面钻出的画面,可以给高分,但很缺憾。

在这一轮测试中,走漏最佳的是即梦,画面很好地展示出了荷花池随风而动的风光,不存在填塞的元素。其次则是可灵,镜头激动丝滑顺畅,起头的闪电也容易修改。清影和拍我各有各的问题,走漏相对较差。

相较于白话化的翰墨,散文庸俗愈加晦涩难解,出现多少偏差也可以知道,能够将荷塘、荷花、荷叶展示出来,可见几款 AI 大模子在东说念主类语言识别方面仍是相等出色。

小结:可灵、即梦并排冠军,清影、拍我略显失色。

从三轮测试的放胆不出丑出,固定镜头下动作幅度较小的场景,关于视频生成大模子来说已不是难题,生成的视频足以以伪乱真。而到了动作幅度较大的场景,可灵和即梦走漏稍强一些。

其中可灵心爱给我方增多难度,比如舞女转个圈、荷塘镜头激动等等,关于翰墨面孔的知道才调也相瞄准确。

即梦以求稳为主,三轮测试均未出现大错。清影则在三轮测试中,均出现了较为严重的问题,生成的第一个视频马儿在空中行走,第二个视频肢体和面部扭曲且动作沉稳,第三个视频未能正确描写出场景。

至于拍我,三轮测试中全体走漏还算可以,除了临了一轮的诡异东说念主头。拍我全球用户已残害 6000 万,在国内商场实力与名气存在落差。

数月前,雷科技曾针对多款 AI 大模子作念过一期评测,它们的走漏却令我大失所望,生成的画面僵硬、伪善。短短几个月夙昔,AI 大模子关于真实宇宙物理变化的知道上涨了一个台阶,光影后果、穿着的舞动等等,都险些难以分辨真伪。

可灵和即梦的背后别离是国内头部短视频平台快手和抖音,领有繁密的视频资源可供纯熟,它们升级幅度亦然最大的。视频模子鸿沟大战将起,可灵与即梦似乎仍是领有了竞争王座的阅历。

据界面新闻报说念,在 2024 年第三季度百度总监会上,百度董事长兼 CEO 李彦宏示意,Sora 这种视频生成模子参加周期长,可能拿不到收益,不管何等火爆,百度都不会去作念。关连词日前百度却在 AI Day 科技绽开日上推出了自研视频生成模子 MuseSteamer 和绘想平台,并声称 MuseSteamer 在巨擘榜单 VBench I2V 中以总分 89.38% 位列全球第一。

雷科技进入绘想进行了一番体验,该平台较为浮松,仅提供视频生成和数字东说念主生成两个功能,其中数字东说念主生得手能暂未绽开,视频生成当今只相沿图生视频。

于是雷科技也用第二轮题目对其进行了测试,除了东说念主物面部脸色不够天然,且动作也略显冉冉外,其他方面走漏不比可灵、即梦等大模子差,光影后果描写到位,尤其是脚部的动作。不外这段视频也有一个问题,绘想似乎想要排斥插入图片的水印,但又没能去除干净。

(图源:绘想生成)

百度进入视频生成模子鸿沟,只须一个解释,那便是看到了视频生成模子的出路,以偏激能够带给百度的利益。

视频生成模子在专科鸿沟已有不少收货,除了起头提到的《SURREAL》,还有《三星堆:畴昔启示录》《中国传闻》《新宇宙加载中》《冰霜》等内容。

绘想平台提供的数字东说念主生得手能,不详率将用于微短剧创作,数字东说念主的形象可以在多个视频中使用,更便于用户创作内容。而且微短剧一集一般在 1 分钟到 3 分钟,创作的难度较低,AI 大模子以至可以提高视频的质料,让微短剧不是停留在大篇幅对话和细小场景,能够展示更多场景。

看成国产视频生成模子的杰出人物,放胆本年第一季度可灵全球用户范畴已残害 2200 万,相较上线初期增长了 25 倍,累计生成了 1.68 亿个视频和 3.44 亿张图片,何况可灵 2.0 模子曾登顶 AI 基准测试机构 Artificial Analysis 图生视频榜单。

不管是可灵、拍我用户数目的爆发式增长,如故百度入局视频生成模子鸿沟,都预示着视频生成模子行将迎来爆发期。不外以当今视频生成模子的才调而言,时常东说念主用其创作长视频难度较高,视频模子在处理大幅度动作方面的才调仍有待晋升。专科团队则有足够的技能实力和资源对视频进行优化,排斥 AI 生成视频的谬误。

视频模子短短数月从生成的视频质料堪忧,发展到完竣无缺,进步号称神速。随机几个月后之后开云体育,视频模子生成的内容将再无违和感,可生成视频的时长也有望进一步增多。



上一篇:欧洲杯体育完了确切的「随身智能」-开云app下载官方网站
下一篇:没有了