北斗六星网

标题: 今天所有的AI概念股都因为Sora技术涨停了 [打印本页]

作者: 花间可可    时间: 2024-2-19 10:56
标题: 今天所有的AI概念股都因为Sora技术涨停了

作者: 花间可可    时间: 2024-2-19 10:57
Turning visual data into patches
We take inspiration from large language models which acquire generalist capabilities by training on internet-scale data.13,14 The success of the LLM paradigm is enabled in part by the use of tokens that elegantly unify diverse modalities of text—code, math and various natural languages. In this work, we consider how generative models of visual data can inherit such benefits. Whereas LLMs have text tokens, Sora has visual patches. Patches have previously been shown to be an effective representation for models of visual data.15,16,17,18 We find that patches are a highly-scalable and effective representation for training generative models on diverse types of videos and images.At a high level, we turn videos into patches by first compressing videos into a lower-dimensional latent space,19 and subsequently decomposing the representation into spacetime patches.

作者: 花间可可    时间: 2024-2-19 10:58
公司网有问题只能贴文字贴不了图
作者: 知音    时间: 2024-2-19 11:54
花间可可 发表于 2024-2-19 10:58
公司网有问题只能贴文字贴不了图



可可过年好!

恭喜发财

作者: 知音    时间: 2024-2-19 11:56
花间可可 发表于 2024-2-19 10:57
Turning visual data into patches
We take inspiration from large language models which acquire gener ...



百度翻译:

将视觉数据转化为补丁
我们从大型语言模型中获得灵感,这些模型通过在互联网规模的数据上进行训练来获得通才能力。13,14 LLM范式的成功部分归功于使用了巧妙地统一了文本的各种形式——代码、数学和各种自然语言——的令牌。在这项工作中,我们考虑视觉数据的生成模型如何继承这些优势。LLM有文本标记,而Sora有视觉补丁。补丁先前已被证明是视觉数据模型的有效表示。15,16,17,18我们发现补丁是在不同类型的视频和图像上训练生成模型的高度可扩展和有效的表示。在高水平上,我们通过首先将视频压缩到较低维度的潜在空间19中,然后将表示分解为时空补丁,将视频转化为补丁。

作者: 花间可可    时间: 2024-2-19 14:21
知音 发表于 2024-2-19 11:54
可可过年好!

恭喜发财

新春快乐!最近特别慢,有时候打不开有时候发不了图片

作者: 知音    时间: 2024-2-19 15:42
花间可可 发表于 2024-2-19 14:21
新春快乐!最近特别慢,有时候打不开有时候发不了图片



怪不得论坛人这么少,可能有些人确实是进不来。

还有人看不见图片,还有人发不了图片。

作者: 金豆豆    时间: 2024-2-19 17:14
真专业啊!
作者: 一只羊    时间: 2024-2-20 13:05
竟然在这里看到我的小可爱,新年快乐,么么哒
作者: 花间可可    时间: 2024-2-20 17:47
知音 发表于 2024-2-19 15:42
怪不得论坛人这么少,可能有些人确实是进不来。

还有人看不见图片,还有人发不了图片。

我是本来就来的少,还总被卡

作者: 花间可可    时间: 2024-2-20 17:47
金豆豆 发表于 2024-2-19 17:14
真专业啊!

openAI管网上摘抄的

作者: 花间可可    时间: 2024-2-20 17:49
一只羊 发表于 2024-2-20 13:05
竟然在这里看到我的小可爱,新年快乐,么么哒

新春快乐么么哒,最近没怎么学歌,得四月以后还有时间了,6月还得考下托福之前的成绩过期

作者: 一只羊    时间: 2024-2-20 18:09
花间可可 发表于 2024-2-20 17:49
新春快乐么么哒,最近没怎么学歌,得四月以后还有时间了,6月还得考下托福之前的成绩过期

嗯嗯,看到你就开心了

作者: 蒙衣客    时间: 2024-2-20 18:17
高端帖子,顶啊
作者: 闲散之人    时间: 2024-2-20 20:19
又是一次智能的飞跃,看了它合成的影像,虽然很短,但是实在前途无量。未来不知道是什么了。只是,我们的硬件芯片的短板是肯定的。
作者: 花间可可    时间: 2024-2-21 10:13
蒙衣客 发表于 2024-2-20 18:17
高端帖子,顶啊

技术革命纪念下,以后可能会发现我们的世界是高一维度的生物虚拟出来的

作者: 花间可可    时间: 2024-2-21 10:14
闲散之人 发表于 2024-2-20 20:19
又是一次智能的飞跃,看了它合成的影像,虽然很短,但是实在前途无量。未来不知道是什么了。只是,我们的硬 ...

算力不足是个大问题,现在租个服务器都很贵

作者: 蒙衣客    时间: 2024-2-24 09:31
花间可可 发表于 2024-2-21 10:13
技术革命纪念下,以后可能会发现我们的世界是高一维度的生物虚拟出来的

元宵节快乐

作者: 花间可可    时间: 2024-2-25 00:49
蒙衣客 发表于 2024-2-24 09:31
元宵节快乐

元宵节快乐!





欢迎光临 北斗六星网 (http://bdlxbbs.top/) Powered by Discuz! X3.1