tag 标签: Sora

相关博文
  • 热度 4
    2024-4-11 16:37
    499 次阅读|
    0 个评论
    科技云报道原创。 “跟不上的可能就要被淘汰了。”看到Sora演示视频后,从业10多年的动画制作师黄斌得出了这样的判断。 随着影视业失业潮呼声渐起,Sora的诞生也给中国AI行业带来了巨大的焦虑。 360集团创始人周鸿祎认为,Sora模型展现出了超越当前中国同类产品的性能和技术水平,这不仅体现在Sora可能实现通用人工智能(AGI)的时间表上,还体现在其实际应用效果和创新能力上。 更有甚者,网上流传着“Sora的诞生是牛顿时刻”的说法,认为Sora代表了新一轮产业革命的兴起。 事实上,国内在经过“百模大战”之后,才刚刚在文本模型上取得显著成果,达到或超过GPT-3.5的水平,并正朝着GPT-4的方向努力追赶。 但Sora的诞生,展示了OpenAI在多模态模型而非单一文本领域的突破性进展,让国内AI厂商追上甚至超越OpenAI,几乎成了不可能完成的任务。 由此不少网友对中国AI发出质问: 为什么Sora没有诞生在中国?中国跟美国的AI差距越来越大,Sora这波国内慢了十年吧?永远都是在追赶路上,为啥没有原创? 在一句句灵魂版的拷问中,中国AI厂商集体陷入了沉默。 那么,在Sora这样的多模态大模型上,中美到底有多大差距?追赶的难点在哪儿?在种种限制之下,中国是否有自己的优势? 中美AI差距几何? 尽管OpenAI承认Sora仍处于开发的早期阶段,需要进一步完善,但业界已形成一个共识——Sora的推出标志着生成人工智能领域的一个重要里程碑。 这是因为Sora不仅仅是一个文生视频的工具,更是AGI的一个关键节点,它验证了一条通向AGI的可行技术路线。 和之前的GPT-3一样,Sora再次验证了Scaling Law可以在这个技术方向上继续发挥作用实现涌现。 而这背后,不仅是惊人的资本和算力支持的结果,更是通过无数工程实验试错和强大技术力量支持的结果。 不少人推断,OpenAI手里应该已经有一个基本完整的多模态GPT-5,可以根据需要随时释放其中的某一部分打击对手,或者引导舆论。 360集团创始人周鸿祎更是直接断言,Sora的出现,意味着AGI(人工通用智能)的实现将从10年缩短到1年。 事实上,在Sora面前,无论是现有的顶级AI模型如Pika、Runway等,还是在多模态AI上有投入的国内厂商,基本上都被“吊打”了。 这也侧面反映出中美在AI技术研发深度和资源投入上的差距。 首先,门槛来自算力。 虽然有学者认为Sora只是一个大约30亿参数的模型,训练成本并没有想象的高,但视频数据本身的处理、标注等成本,加上长视频在推理阶段注定的巨大token数量和算力消耗,显然对任何公司都是难以承受的挑战。 即便Sora真的只有30亿参数,视频分析对算力的消耗应该也是远远超过一个千亿模型的。在国内GPU被卡脖子之后,算力是一个巨大的挑战。 其次,是高质量的数据。 根据OpenAI发布的技术报告,Sora强大能力归功于两点:其一是使用了基于Transformer的扩散模型(Diffusion Model);其二是将不同类型视觉数据转化为统一格式——像素块(patch),从而能利用数量庞大、质量过硬且算力性价比高的数据。 业内人士认为,数据质量和数量上的显著优势,很可能是Sora成功的最关键因素之一。 在算力方面,虽然OpenAI训练Sora模型使用的GPU卡数量并非无法企及,但其他公司在具备足够硬件资源的情况下,仍然难以复制OpenAI的成功,主要瓶颈还是在于如何获取和处理大规模高质量的视频数据。 2022年,OpenAI曾宣布以创新方法来训练AI模型,省去标注大量资料的训练过程。 据报道,OpenAI所公布的视频预训练模型(VPT),让AI学会了在《我的世界》里从头开始造石镐。 研究人员首先收集一波数据标注外包们玩游戏的数据,其中包含视频和键鼠操作的记录。 然后,利用这些数据制作逆动力学模型(IDM),从而推测出视频里每一步在进行的时候,键鼠都是怎么动的。这样只需比原来少很多的数据就可以实现目的。 这项研究发表于2022年6月,同时文中还注明这个工作已经进行了一年之久,也就是说,OpenAI至少从2021年起就开始进行这项研究。 Logenic AI联合创始人李博杰认为,OpenAI的先发优势决定了早期的数据壁垒,对于后进入市场的公司来说,增加了追赶的难度。 “即使是谷歌这样全球数据量最大的公司,在训练大模型时,训练数据也未必能比OpenAI更好”,李博杰表示。 相比之下,国内公司在数据上的积累和利用上也存在一定差距:一方面,由于政策变化和其他限制,后来者可能无法获取之前可用的一些关键数据;另一方面,随着AI生成内容越来越多地充斥互联网,原始的真实世界数据被“污染”,使得获取高质量、无偏见的训练数据更加困难。 最后,是创新的训练方法。 Sora实现了将Transformer和扩散模型结合的创新,首先将不同类型的视觉数据转换成统一的视觉数据表示(视觉patch),然后将原始视频压缩到一个低维潜在空间,并将视觉表示分解成时空patch(相当于Transformer token),让Sora在这个潜在空间里进行训练并生成视频。 接着做加噪去噪,输入噪声patch后,Sora通过预测原始“干净”patch来生成视频。 OpenAI发现,训练计算量越大,样本质量就会越高,特别是经过大规模训练后,Sora展现出模拟现实世界某些属性的“涌现”能力。 总的来说,Sora是好的架构+好的数据,然后把模型做大,达到量变到质变。 尽管Sora在方案设计上大部分是已有的技术,但能够做出惊艳效果的也只有Sora,这也说明在训练过程中有很多训练技巧的问题要解决。 中国AI厂商能否 追赶OpenAI? Sora的技术突破让AI焦虑在国内蔓延开来,但中国AI并非完全无招架之力。在Sora出现并占据大众视野之前,国内也曾有多家上市公司在多模态AI方面展开过布局。 2023年12月18日,东方证券在一份研报中提及,国内的海康威视、大华股份、萤石网络等视频分析行业领先厂商,纷纷投入到多模态大模型研究和行业应用落地进程。 与此同时,百度、阿里、腾讯、华为、字节跳动等大厂也都布局了多模态基础大模型。 据不完全统计,2023年12月至今三个月内,已有包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信等在内的十余家A股公司,在投资者互动平台披露过视频生成模型领域的业务情况。 尽管目前国内厂商呈现的“文生视频”效果远不如Sora,但Sora所用到的基础模型LLM、文生图模型DALL·E 3、大规模视频数据集、AI算力体系、大模型开发工具栈等核心基础设施,中国都已经具备。 比如原创的基础大语言模型文心一言、讯飞星火、BAICHUAN等,以及文生图模型文心一格、腾讯混元等,加上过去一年大模型基础设施的突飞猛进,有能力和条件支持中国AI修成正果,在视频生成赛道再现类似ChatGPT式的成功。 腾讯研究院资深专家王鹏认为,Sora的发布进一步明确了DiT(=VAE编码器+ViT+DDPM+VAE解码器)是多模态AI的可行方向,中国AI大厂仍然有可能以现有资源在一年左右接近Sora目前的水平。 中国AI的机会 事实上,不仅是技术代际差异并没有想象中的那么大,视频生成模型走向行业的长跑才刚刚开始。大模型的价值需要商业化来证明,Sora也不例外。 首先,相比“人人皆可上手”的大语言模型,视频生成模型的应用门槛更高,受众群体更小。目前OpenAI仅开放给创作者使用,而非像ChatGPT那样开放给大众。 不难看到,视频生成模型从研发到落地,整个过程会更加缓慢,应用潜力与商业出口还有待探索。 其次,Sora虽然强大,但成本确实是一个现实问题。 有人估算,Sora生成一条视频的成本在几美元到几十美元不等,如果普及到大众使用,成本需要降到目前的1%才能接受。 降低成本的同时提高生成质量和逻辑连贯性,是亟待解决的关键挑战。 同时,考虑到无法解决“幻觉”的问题,要想生成真正可控可用的视频,短期内成本高昂。 这些局限性,都为中国AI产学各界留下了较长的追赶窗口期。 目前,Sora能够激活多大的商业价值尚不明确,但是利用大模型找应用场景却是中国市场的优势所在。 中国拥有丰富的行业和场景,如果中国AI厂商能为垂直的行业用户解决具体的场景问题,打磨好工具,做好视频生成模型的提示词工程,以便非专业背景的广大行业用户们上手使用,那么在特定领域超过GPT-4甚至是GPT-5的可能性是非常大的。 不仅如此,中国AI厂商也可以在Sora等大模型的基础上,做进一步的应用创新,例如在Sora之上能够提供更复杂的视频剪辑能力、革新医疗教学与模拟训练等,从而率先探索出商业化之路。 结语 Sora作为人工智能视频生成技术的重大突破,显示了中美之间存在显著的技术差距。这对于中国科技界而言,既是警醒也是鞭策。在承认现实差距的同时,中国AI也不必妄自菲薄,审视自我、调整战略、奋起直追,抓住机会窗口,才是弯道超车的必由之路。 【关于科技云报道】 专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
  • 热度 2
    2024-3-24 09:15
    282 次阅读|
    0 个评论
    Sora的出现,应该让孩子如何思考才能跟上这个时代?
    Sora 的出现,应该让孩子如何思 考才能跟上这个时代? 未来机器人将会替代人类,不懂编程获将被淘汰?随着当今社会技术的快速发展,越来越多的人工智能出现并占据了部分市场,从Alphago到无人驾驶到ChatGPT再到如今的Sora,不得不承认的是科技创新一直在发展并且速度也是越来越快,不免部分家长开始忧心孩子的未来,在正式开始我们的话题之前,先给大家介绍一下Sora。 Sora是一个可以通过文本描述生成视频的人工智能生成模型,由美国人工智能研究机构OpenAI开发。Sora这一名称源于日文“空”(そら sora),以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。 那么接下来我们来看两个例子: 提示词:两艘海盗船在一杯咖啡中航行,展开激烈的战斗。视频采用逼真的写实风格,将海盗船的细节展现得淋漓尽致,战斗场面栩栩如生。 提示词:一位时尚的女士在一条充满温暖闪亮霓虹灯和动态城市标志的东京街道上行走。她穿着一件黑色皮夹克,一条长长的红色连衣裙,和一双黑色靴子,背着一个黑色的手袋。她戴着墨镜,涂着红色唇膏。她自信而随意地行走。街道潮湿而反光,产生了彩色灯光的镜面效果。许多行人在街上走动。 看完这两个案例之后,大家是不是觉得很震撼,这真的是AI所生成的视频吗?如果不说这是AI生成的,相信绝大多数人都会认为这是现实生活中拍摄的视频。因此Sora的出现也是人工智能方面的一大突破,也引发十分激烈的讨论。 在这样的大环境背景下,未来会是什么样子的我们还无法预测,但是科技肯定是越来越先进的,因此我们不免忧心孩子的未来,要怎么做才不会被社会所淘汰呢?这个问题引发我们无限思考。 教育的重要性 首先, 我们需要构建一个更为宽广且自由的学习天地,让孩子们得以在充裕的时间与空间中,像繁星般各展其才,绽放个性的光辉。 其次, 教育应当如同守护灯塔一般,小心翼翼地保护每一份初生的好奇心,并以智慧为火种,点燃学生们的想象力之焰,使其在知识的海洋中无畏探索、翱翔。 再者, 我们要引导学生成为有崇高价值追求的人,鼓励他们不仅着眼当下,更应胸怀大志,远瞻未来,避免被短期功利主义的迷雾所遮蔽,从而实现精神世界的升华。 与时俱进 与时俱进是万事万物发展的根基,要想不被淘汰就一定要赶上时代的步伐,教育亦是如此,青少年是未来中国梦的建造者,新鲜事物会一直出现,孩子们除了要学习学校里的基础课程以外,编程课程的学习也是很必要的,未来必定是高科技、人工智能的时代,因此编程语言也将成为一门不可或缺的语言知识。 学习要趁早 研究表明,5-11岁的孩子在学习算法和计算上有着突出的潜质,而且等孩子上了初中、高中,学业繁忙的原因,根本没有时间去学习学校课程之外的知识,所以越早学对孩子帮助越大,编程语言本身就是一个积累的过程,是需要不断学习的。 这样的教育改革无疑是对现行体系提出了更高的挑战。目前,我们往往过于关注知识的灌输量和掌握程度,强调实用性和前沿性,却容易忽视了对学生内心世界中好奇心与想象力的培育以及价值观的塑造。然而随着时代的进步和社会意识的觉醒,越来越多的声音开始呼唤回归教育的本质,尊重学生的个体差异,珍视他们的好奇心与想象力,这无疑是一个令人振奋的趋势。 教育改革之路并非坦途,既有传统观念的桎梏,又有市场压力的鞭策,还有社会1环境的制约。但正是这些共鸣愈发响亮,学生个性化发展的理念日益深入人心,让我们看到了希望的曙光。在中国经济持续跃升,社会对于创新人才需求日益迫切的大背景下,创新人才教育必将迎来一场深刻且富有生命力的变革,它将如春风吹破冰河,带来教育的新篇章,滋养出一代代能够引领时代潮流、推动社会进步的创新型人才,让我们翘首以待。 而快乐二进制一直不断在编程教育、未来科技创新方面贡献力量,在编程语言、数据算法、人工智能方面不断研究发明,为中国科技更好的明天而不断努力!
  • 热度 1
    2024-3-16 18:15
    336 次阅读|
    0 个评论
    继ChatGPT后,文本生成视频模式Sora的发布再次震撼全球,短短几天里,在AI人工智能培训市场也掀起了涟漪。 与此同时,有一种声音在互联网及不少家长中流传:传统教育优势荡然无存,“卷分数”不如“躺平”。Sora给教育和人才培养带来了哪些启发和思考?着眼于孩子的成长,AI时代,学校、家长又该如何看待和应对这些变化? 除了影视、广告行业 Sora会给教育带来哪些影响呢? 那么在正式开始我们的话题之前先给各位家长介绍一下什么是Sora? Sora是由OpenAI开发的一款先进的视频生成工具,它利用最新的人工智能技术,使用户能够通过简单的文本提示来创造高质量的视频内容。 Sora的设计宗旨是为了简化视频制作过程,降低创作门槛,同时提供足够的灵活性,以适应各种创作需求和风格。 在意大利布拉诺一排排鲜艳的彩色建筑中,一只可爱的斑点狗正通过窗户好奇地望向外面。与此同时,街道上人来人往,有的步行,有的骑行。 面对功能如此强大的人工智能,还需要埋头苦读吗?我们的教育方式是否要发生变化呢? 教育这件事,理念好,实践难。2500 多年前孔子就已经说过:有教无类(对象的全体性)、因材施教(学生的独特性)、为仁由己(个体的自主性)、和而不同(实践的创造性)。但在实际教育过程中,往往会在规模和效果中权衡,面向大众的教育产品会失去个性化,过于个性化的教育又很难规模化。这个矛盾应该不用过多论述,至少目前主流的依然是大班上课,老师很难充分照顾到每个学生不同的学习能力和知识/技能水平。 一对一模式的普及: 接受一对一教学的学生比传统教室的学生表现优越。AI有可能成为每个人的实时家教,生成个性化学习计划,为学生提供适合其技能水平的内容,而人类教师则提供深度知识和情感支持;AI还能让专家、知名学者、历史人物、虚拟角色触手可及;AI作为心理治疗师,价格更低、更易获取,也可能比传统的人类治疗师更易于接触。 教师和学生将迎来AI工具的新时代: AI可以通过学习大量教育材料来减轻教师的备考、批改工作负担。这样,教师就可以把更多时间花在其他事情上;对于学生来说,他们总是喜欢寻找节省时间和获取优势的创新方法。 在这个人工智能高科技的时代,适当的学习定然是必要的,但是全方面发展是首要的,需要协调好时间分布,在埋头苦读的时候也要学会利用现有的学习工具,综合发展,只有这样才不会被社会所淘汰。 那么我们的教育方式需要改变吗? 时代性是很多事物必备的性质,自然教育也是如此,跟不上时代只会被淘汰,因此不论是基础教育还是如今很火的少儿编程教育都要紧跟时代的步伐,结合现有的人工智能开展更适合孩子们学习的课程。 首先 创造力和创新精神 是未来成功的关键。当孩子们具备创造力和创新能力时,他们能够快速适应未来的挑战,并迅速找到新的解决方案。 其次 学习编程和数据科学 是非常重要的。AI的基础是数据科学和编程,因此,一个了解编程的企业或负责制作AI的程序员,将会比那些不了解编程的人更具竞争力。家长可以寻炸一些线下的机构让孩子系统性地学习。 由于AI领域的快速发展,孩子们正在成长的过程中,所学的技能和知识在短时间内就会过时。因此,孩子们需要具有 自主学习习惯 ,例如积极的探究、搜索和发现,来保持自我学习和对未来的关注,不断地更新他们的技能和知识。 孩子需要学习和理解 团队合作 的重要性,能够与他人积极协作,解决问题并创新。大量的团队合作及沟通练习将为孩子以后在职场上的表现打下基础。 在未来,孩子需要具备 分析思维和问题解决能力 。孩子需要学会提出问题、分析不同情况、并寻找最佳解决方案的能力。 在未来,孩子们需要具备 学习新技能的能力 。随着技术的发展,孩子也要不断学习新的技能和知识,来跟上技术的发展和变化。 总而言之,随着现在各种技术的快速发展,而我们能做的只有不断学习紧跟时代的脚步,只有这样才不会被社会所淘汰,为孩子规划好未来的方向以及实施计划也是十分必要的。当然我们也不需要过分焦虑,如何调整好自己的心态也是十分重要的一部分! 为了科技人才的培养、国家科技的发展快乐二进制青少儿编程一直在不断努力,从数学算法、人工智能等方面提高青少儿的逻辑思维、分析问题解决问题的能力!正在开展编程教育大模型的研发,sora方面的探索研究!
相关资源
  • 所需E币: 0
    时间: 2024-3-31 17:44
    大小: 945.64KB
    上传者: 快乐二进制
    Sora的出现给中国编程教育带来了巨大的影响,将推动编程教育向更加智能化、个性化的方向迈进。在Sora的帮助下,学生可以享受到更加智能化的学习体验,教师可以更好地进行教学辅助,家长们也将更加关注编程教育的创新性和个性化程度。可以期待随着Sora的进一步应用和发展,中国编程教育将迎来更加美好的未来,为培养更多优秀的程序员和科技人才做出更大的贡献。