• ag真人百家乐会假吗 好家伙,海螺胜利拍了个AI版的《教父》

    发布日期:2024-12-07 02:55    点击次数:125

    奇月 发自 凹非寺量子位 | 公众号 QbitAIag真人百家乐会假吗

    家东谈主们,是这么的,前几天上网冲浪,刷到了这么一条视频。

    固然能看出来是AI生成的,但本来就很可爱《教父》这种暗黑风的我,还是被这短短90秒硬控住了……

    话未几说,各人先一都赏玩一下:

    https://mp.weixin.qq.com/s/L-RMFzQOLyuKk1EGFhk0qA?token=967695030&lang=zh_CN

    这阴晦的环境、严肃的东谈主物神态、还有弥留的剧情,太对味儿了。

    这条短片里,一共有四个主东谈主公,还触及许多复杂的场景和光效,画面居然一直都没崩。

    深扒了背后的AI创作经由之后,扫尾让我大受颠簸啊!

    本来以为这片子的责任流可能就和日常的AI生成一样,无尽地修改教导词+抽卡,抽出一个能用的首帧图片,再图生视频。

    反复上头的经由,凑出所有视频段落,拼起来,这么才能拼集保捏跨片断保捏东谈主物一致性。

    比如主角老翁在14秒、1分10秒都出现了,若是你思让东谈主物的脸不崩,就得无尽抽卡+图生视频轮回,或者是训个LoRA模子,把东谈主物框定好:

    但这个短片的制作经由,只用了这四张东谈主物像片,再配上一些文本Prompt,就可以导上演来了。

    也即是说,格外于胜利给你提供了4位现成的演员,你只用作念导演辅导他们就好了??

    这比之前靠玄学出片的AI短片制作来说,确实是降维打击了啊。

    不卖关子,其实这是MiniMax家的海螺AI最近推出的新功能——主体参考,你只需要上传需要的东谈主物图片,它就可以自动识别出东谈主物,让他们听你的话,帮你演戏!

    有了这个功能,短剧制作的资本将会大幅镌汰,通盘制作经由都可能会被AI视频模子颠覆。

    若何作念到的?

    底下咱们来详备了解一下“主体参考”功能的旨趣。

    它最大的改进之处,就在于把“文生视频”和“图生视频”的优点给集结起来了

    文生视频的优点,是通用性、泛化性和组合性都可以,可光靠笔墨来舍弃,细节上很容易出现偏差。

    图生视频固然能让生成的视频牢牢征服首帧图片,相当精确,但问题是目田度不高,况兼首帧图片的精确信息和笔墨模样之间也可能存在矛盾。

    针对这些问题,MiniMax公司深切分析了自家的三模态自研基座模子,他们以为,这三个模态的智能不是全都寥寂的,其实是能彼此促进、共同跨越的

    讲话骨子上是智能的通用用具,大讲话模子对视觉和讲话认识的跨模态底层意会智力亦然很强的。

    在这个思法的基础上,海螺AI自研了基于单张图片的主体参考功能,相当接近东谈主类处理视觉和笔墨信息的步地。

    比如濒临一张图片,模子会先把图片里的“主体”这个视觉信息索要出来,然后用户就能用笔墨目田地去操控,还能把主体的视觉细节还原得相当准。

    这么一来,一个主体既能精确地保捏正本的模样不变,又能按照用户的思法目田地作念出各式步履、进展出各式现象。

    经过测试,哪怕只用一张东谈主物图片,也能兑现精确归附。

    比如只上传一张经典meme东谈主物,就能生成多场景视频:

    你可以让金馆长在酒吧里舞蹈、或者吃点意大利面:

    生成视频的质地,和给到图片的显着度胜利关连,测试下来,即使梗图不算显着,海螺AI也能保捏东谈主物还原,当作当然。

    再来和另一条本清爽线测验LoRA东谈主像模子对比一下。

    MiniMax也究诘过LoRA决议,但他们发现,比较于精调的LoRA,主体参考使用的图片参考决议生见效果上限大概更高

    此外,主体参考的决议,相较LoRA 决议,ag真人百家乐官网也大幅镌汰了用户输入与计较资本

    相同的视频效果,海螺需要1张图片输入+普通一次生成的资本,而使用LoRA决议的,则需数十个特定视频、超100倍计较量来兑现微调,外加数十分钟恭候时辰。

    现在海螺AI起首通达的主体参考智力主要针对单个东谈主物,后续还会拓展到多东谈主、物体、场景等更各类化的参考。

    外星东谈主格调的也可以生成:

    若是你也思尝试一下主体参考的新功能,操作措施也相当通俗。

    你只需要在海螺AI创意视频平台中接受“主体参考”创作区后,上传一张图片即可创建参考扮装。

    然后不才面的文本框内输入Prompt,就可以生成裕如创意的高质地视频。

    况兼在使用过程中,咱们还夺目到它在以下方面生见效果也相当出色。

    东谈主物面部细节一致

    在用东谈主物特写生成视频时,可以看到东谈主物的面部细节在多个视频中都能得到很好的保留。

    不仅是轮廓和五官,致使包括眉毛、眼影、发型都有很强的一致性。

    尤其是扮装脸上这三颗痣,在3个视频扫尾中都保捏的固定的位置,且显着可见,现在唯有海螺AI一家模子可以作念到这么的细节一致性。

    复杂姿势与神态

    在当作,环境上,也大概兑现目田组合,致使用神态传递心计,也可以兑现。你可以操控东谈主物生成更多复杂的姿势,比如垂头、侧脸等等。

    先来让图片中的女士挑战一下垂头的当作:

    Prompt:在这略显空旷的房间之中,一位长发女东谈主静静地伫立着。色泽透过窗户,洒在她的身上,勾画出一谈寂寥的身影。只见她体态略显僵硬,双肩微微下千里,仿佛承受着无形的重压。她的头颅逐步低下,当作安静而千里重,如同被岁月的沧桑拖拽着。颈部的肌肉紧绷,青筋笼统表示,似乎在费力克制着某种心计。下巴徐徐靠近胸膛,几缕发丝从额前滑落,遮住了她泰半的面貌,让东谈主难以看清她此刻的神情。

    在侧脸这个比较小众的主题上,海螺AI也作念到了让镜头的迤逦和头发的畅通相当丝滑:

    Prompt:当然表象布景,画面中一位女性线条利落却又不失柔柔的侧脸,宛如一幅缜密的古典画卷在目下徐徐张开。她的额头广大而平整,长发被风吹动。高挺的鼻梁犹如一座峻峭的山脊,从额头胜利地延长而下,线条优好意思。她转及其,对着镜头,优雅地笑了一下。

    AI出片,还是要本领处分期骗瓶颈

    Sora的横空出世点亮了视频生成的赛谈。而纵不雅本领和期骗发展近况,现在主要瓶颈在于,本领实在参加坐蓐环境,兑现行业期骗。而要让视频实在承担起叙事任务,就必须把东谈主物一致性的门槛打下来

    可以说,有了“主体参考”功能后 ,冲破了跨视频片断的主体一致性的创作痛点,让用户在进行更完好内容抒发的视频创作时,可将更多元气心灵放在内容抒发上。

    关于AI 短剧、AI 告白等以东谈主物为主体的行业,这个功能可以大大培植创作效力,镌汰创作资本,带来更大的思象空间,鼓励行业参加 “东谈主东谈主都是会掌镜、懂拍摄的好导演” 的新时期。

    MiniMax固然是一家设立刚刚3年的国内初创公司(设立于2021年12月),但在AI范畴已赢得权贵设立。

    海螺AI在外洋超 180 个国度和地区也得益了热度与招供,成为外洋AI爱重者口中的热词,也被视为代表中国先进 AI 本领的代名词。

    视频模子海螺AI,自推出起就进展相当出色,在VBench、Video Arena等多个国际巨擘评测榜单的第三方寥寂测试中概括排行第一,在画面质地、连贯性、通达性等多维度处于率先地位。

    ######AI产物榜12月榜单

    在国内视频模子范畴,现在主要流行的产物多是头部互联网大厂 “纵欲出遗址” 的后果,包括快手的可灵和改日值得期待的字节即梦AI等。

    MiniMax则凭借团队科研实力、前瞻的本清爽线接受和多模态并举的政策,成为创业公司中独一能和大厂掰手腕的一家

    改日,视频模子行业的竞争会愈加各类化,包括个性化创作的制定、坐蓐经由的专科度、期骗的行业、各家公司的本领积存和改进等等。

    也将愈加戒备与其他本领的协同发展,如与智能体、造谣施行、增强施行本领集结,为用户带来更千里浸式的感受。

    期待有更多像MiniMax一样戒备本领改进、敢于探索的公司,能为咱们带来愈加智能和优质的模子体验。

    点击官网连气儿即可体验“主体参考”新功能哦:

    国内用户创作进口:hailuoai.com/video/create

    外洋用户创作进口:hailuoai.video/create