Meta

云图NFT持续分享全球最新优质Al内容，每天更新，欢迎收藏

标签

Meta-共 0 个作品今日上传 0个作品

升级会员发布作品

Audiobox-Meta推出的新一代音频生成模型

Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。 Audiobox是Voicebox的继任者，进一步推动了音频生成领域的发展。与Voicebox相比，Audiobox具有更强大的可控性，用户可以使用文本描述提示来指定语音和音效的风格，这是Voiceb…
AI视频
- 17
- 0
admin24年9月29日
MusicGen-简单可控的音乐生成模型

MusicGen是什么？ MusicGen 是一个由Meta发布的开源 AI 音乐生成模型，可以根据你输入的描述文本生成新的音乐，也可以上传现有的音乐旋律作为参考。 MusicGen基于 Transformer 架构，可以高效处理音频和文本数据。测试表明，MusicGen 的性能可与 Google 的 MusicLM 媲美。 MusicGen可以做什么？文本提示音乐生成：MusicGen 可以根…
AI视频
- 33
- 0
admin24年9月29日
CM3leon：可生成文本和图像的多模态大模型

CM3leon是什么？ CM3leon是Meta AI开发的一种大型语言模型，可生成文本和图像。它是一种自回归模型，这意味着它可以一次生成一个文本或图像的令牌或像素。这使它比其他仅以特定方式生成文本或图像的生成模型更具通用性。 CM3leon比其他生成模型更有效率。它可以训练在较小的数据集上，并且可以更快地生成文本或图像。这使它成为速度和效率很重要的应用程序的理想选择。 CM3leon可以做什么？…
AI视频
- 19
- 0
admin24年9月29日
Code Llama： Meta AI 推出的免费可商用的AI编程利器

Code Llama是什么？ Code Llama是一种先进的大型语言模型（LLM），由Meta AI 推出，专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的，并提供三个模型：基础代码模型Code Llama、专门针对Python的Codel Llama，以及针对理解自然语言指令进行微调的Code Llama - Instruct…
AI视频
- 28
- 0
admin24年9月27日
Imagine with Meta：Meta发布的独立AI图像生成器

Imagine with Meta是由Meta发布的独立AI图像生成器，由自家的影像生成模型Emu 支援，可以根据使用者提供的自然语言描述来形成高画质图像，目前已在美国开放一般用户免费使用，每次提示会产生4 张图片提供使用选择。 Meta 指出，将在未来数周内开始为Imagine with Meta 添加不可见的浮水印，以提高AI 生成内容的透明度以及可追溯性，目前仅有一个可见的浮水印。Meta …
AI绘画
- 31
- 0
admin24年9月27日
SeamlessM4T：Meta发布的多语言语音翻译模型

周二，Meta 宣布推出 SeamlessM4T，一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络，它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译，支持「最多 100 种语言」，Meta 表示，它的目标是帮助说不同语言的人更有效地交流。继续 Meta 相对开放的人工智能方法，它正在以研究许可（CC BY-NC 4.0）的形式发布…
AI办公
- 68
- 0
admin24年9月27日
Meta AI

Meta AI 是什么？ Meta AI 是由 Meta（前身为 Facebook）推出的先进人工智能平台。该平台涵盖了多个应用场景和服务，包括自然语言处理、图像识别、以及深度学习等多个方面。 Meta AI 可以做什么？跨平台交互：Meta AI 可以在 WhatsApp、Messenger、Instagram 等多个平台上进行交互，提供实时信息和服务。图像生成与编辑：通过 Restyle …
AI视频
- 20
- 0
admin24年9月27日
Llama 3.1：Meta最新推出的开源大语言模型

Llama 3.1是什么？ Llama 3.1是Meta最新推出的开源大语言模型，有三种规格：8B（80亿）、70B（700亿）和405B（4050）亿参数，支持八种语言，具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力，开放下载并允许开发者定制和微调。Llama 3.1还包括增强的安全工具和广泛的合作伙伴支持，适用于多种AI应用开发。 Llama 3.1的主要…
AI训练模型
- 26
- 0
admin24年8月11日
LAVE是什么？ LAVE是一个由Meta发布的全新AI自动视频剪辑工具，通过自然语言交互和语言增强功能，帮助用户简化视频编辑流程。它结合了视频画廊、编辑时间线和对话代理，支持创意头脑风暴、视频检索、故事板制作和剪辑修剪等功能。用户研究显示，LAVE能有效提升视频编辑效率和创造力，同时强调了未来系统设计需考虑用户多样性和适应性，以及潜在的偏见问题。 LAVE可以做什么？ LAVE的主要功能包括：语言增强视频画廊：自动为用户的视频生成语言描述，包括视频的标题和摘要，帮助用户快速理解视频内容，无需播放视频即可预览。视频编辑时间线：允许用户通过拖放操作来排序和修剪视频剪辑，同时支持LLM辅助的剪辑排序和修剪功能。视频编辑代理：通过对话界面，用户可以与LLM代理进行交流，代理根据用户的编辑目标规划并执行相关动作，如故事板制作、视频检索等。故事板制作：代理可以根据用户提供的叙事或自动生成叙事，帮助用户将视频剪辑按顺序排列，形成连贯的故事线。视频检索：用户可以通过自然语言查询来搜索和检索与特定主题或活动相关的视频。创意头脑风暴：代理协助用户基于已有视频内容生成视频编辑创意，激发用户的创造力。剪辑修剪：用户可以通过输入自然语言命令来精确修剪视频片段，LLM会根据命令和视频内容自动确定剪辑的开始和结束点。这些功能共同构成了LAVE的核心，旨在通过LLM的智能辅助，降低视频编辑的技术门槛，提高编辑效率，并增强用户的创作体验。如何使用LAVE？ LAVE目前发布了论文，具体产品暂未公布，欢迎扫码下面二维码，关注AIHub公众号，第一时间获取最新上线通知。论文地址：https://arxiv.org/pdf/2402.10294.pdf

LAVE-Meta发布的AI自动视频剪辑工具
AI视频
- 23
- 0
admin24年7月2日
Meta AI助手是什么 Meta AI是一款由Meta公司最新推出的基于先进的Llama 3模型的免费AI智能助手。它被设计用于Meta旗下的多个社交平台，包括Facebook、Instagram、WhatsApp和Messenger，以及通过网页版Meta.ai访问。Meta AI旨在通过自然语言处理技术，为用户提供信息检索、知识学习、内容创造和社交互动等功能。 Meta AI助手的主要功能智能对话：Meta AI能够理解和处理自然语言，与用户进行流畅的对话交互。搜索集成：在社交平台内整合搜索功能，提供来自Bing和Google的实时搜索结果。图像生成：具备“Imagine”功能，可以根据文本描述快速生成高质量的图像。动画和GIF制作：能够将静态图像转换成动画或GIF，增加内容的动态效果。个性化推荐：根据用户的喜好和需求提供个性化的建议，如餐厅推荐或周末度假计划。学习和教育：帮助用户解答学术问题，如解释遗传特征等。创意激发：通过生成灵感图片，协助用户在装饰、服装搭配等方面的创意思考。多平台可用性：除了社交平台和网页版，Meta AI还可在智能眼镜和Meta Quest头显设备上使用。如何使用Meta AI助手？ Meta AI助手目前已经在澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等十几个国家/地区推出，后续会扩展到更多国家和地区。官网访问：访问Meta AI助手的官方网站Meta.ai。输入问题：在网站的底部输入框中输入你想要询问的问题或主题。无需登录使用：你可以不登录直接使用Meta AI，但如果需要保存对话历史和生成图片，则需要登录Facebook账户。创建新对话：用户还可以点击“New conversation”来开始一个新的对话或主题讨论。 AI绘画功能：用户可以点击“Imagine”进行AI绘画创作，但此功能需要登录账户。 Meta AI的推出，标志着Meta在AI领域的进一步扩展，同时也为用户提供了一个多功能的智能助手，以增强其在社交平台上的互动体验。

Meta AI 助手-Meta推出的免费AI智能助手
AI视频
- 22
- 0
admin24年7月2日
Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。 Audiobox是Voicebox的继任者，进一步推动了音频生成领域的发展。与Voicebox相比，Audiobox具有更强大的可控性，用户可以使用文本描述提示来指定语音和音效的风格，这是Voicebox不支持的功能。通过同时使用语音输入和文本提示，用户可以实现自由形式的语音重塑，这在当前的模型中尚属首次。这款模型的独特之处在于，它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如，如果有人想要生成一片音景，他们可以给模型一个文本提示，如“一条奔流的河流和鸟儿的鸣叫”。 Audiobox不仅在语音生成方面表现出色，还在音效生成方面表现出色。经过内部测试，Audiobox在质量和相关性方面明显超过先前的最佳模型，并在主观评估中以超过30%的样式相似性优势击败了Voicebox。为了促进领域的发展并确保研究的负责任性，Meta计划邀请研究人员和学术机构申请资金，用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切，强调了与研究社区合作的重要性。 Audiobox的推出标志着音频生成领域的一项重要进展，Meta希望通过这一创新降低音频创作的门槛，使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响，为未来的音频创作开辟了新的可能性。了解更多信息：https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/

Audiobox-Meta推出的新一代音频生成模型
AI视频
- 19
- 0
admin24年7月2日
MusicGen是什么？ MusicGen 是一个由Meta发布的开源 AI 音乐生成模型，可以根据你输入的描述文本生成新的音乐，也可以上传现有的音乐旋律作为参考。 MusicGen基于 Transformer 架构，可以高效处理音频和文本数据。测试表明，MusicGen 的性能可与 Google 的 MusicLM 媲美。 MusicGen可以做什么？文本提示音乐生成：MusicGen 可以根据文本提示生成新的音乐片段，这些提示可以选择性地与现有的旋律对齐。高质量样本生成：通过使用高效的令牌交错模式和单阶段方法，MusicGen 可以生成高质量的音乐样本，无需复杂的级联模型。如何使用MusicGen？ MusicGen在线体验地址：https://huggingface.co/spaces/facebook/MusicGen；使用步骤如下：打开：https://huggingface.co/spaces/facebook/MusicGen；如下图所示，输入文本描述，即你想生产的音乐描述；上传参考的音乐旋律，这是个可选项，也可以不上传；点击下方的生成【Generate】按钮，等待几十秒即可生成音乐；点击播放最右边生成的音乐，即可播放和下载。另外，在操作下方，也提供了一些参考demo，点击即可体验。相关资源链接论文地址：Paper 谷歌实验室：Google Colab 源代码：Github 在线体验：Demo

MusicGen-简单可控的音乐生成模型
AI视频
- 19
- 0
admin24年7月2日
CM3leon是什么？ CM3leon是Meta AI开发的一种大型语言模型，可生成文本和图像。它是一种自回归模型，这意味着它可以一次生成一个文本或图像的令牌或像素。这使它比其他仅以特定方式生成文本或图像的生成模型更具通用性。 CM3leon比其他生成模型更有效率。它可以训练在较小的数据集上，并且可以更快地生成文本或图像。这使它成为速度和效率很重要的应用程序的理想选择。 CM3leon可以做什么？生成逼真的文本和图像提高机器翻译创造新的艺术形式 CM3leon优势通用性：CM3leon可用于生成文本和图像，而其他生成模型只能生成其中之一。效率：CM3leon可以训练在较小的数据集上，并且可以更快地生成文本或图像。潜在应用广泛：CM3leon可用于各种任务，包括生成逼真的文本和图像、提高机器翻译和创造新的艺术形式。总体而言，CM3leon是一种具有广泛潜在应用的新型有前途的生成模型。它比其他生成模型更具通用性和效率，使其成为各种任务的理想选择。博客原文：https://ai.meta.com/blog/generative-ai-text-images-cm3leon/ 论文地址：https://ai.meta.com/research/publications/scaling-autoregressive-multi-modal-models-pretraining-and-instruction-tuning/

CM3leon：可生成文本和图像的多模态大模型
AI视频
- 24
- 0
admin24年7月1日
Code Llama是什么？ Code Llama是一种先进的大型语言模型（LLM），由Meta AI 推出，专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的，并提供三个模型：基础代码模型Code Llama、专门针对Python的Codel Llama，以及针对理解自然语言指令进行微调的Code Llama – Instruct。Code Llama在代码任务方面超越了现有的先进公开LLM，并且可免费用于研究和商业用途。 Code Llama 是 Llama 2 的代码专用版本，是通过在其特定于代码的数据集上进一步训练 Llama 2 来创建的，从同一数据集中采样更多数据的时间更长。从本质上讲，Code Llama 具有增强的编码功能，建立在 Llama 2 之上。它可以根据代码和自然语言提示生成代码和有关代码的自然语言（例如，“给我写一个输出斐波那契序列的函数。”）它还可用于代码完成和调试。它支持当今使用的许多最流行的语言，包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。详细介绍：ai.meta.com Code Llama GitHub：https://github.com/facebookresearch/codellama 下载 Code Llama 模型：https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 阅读研究论文：https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ Code Llama可以做什么？生成代码: Code Llama可以使用文本提示生成代码，支持包括Python、C++、Java、PHP、Typescript（Javascript）、C#和Bash等多种流行语言。代码补全和调试: 它可以用于代码补全和调试，支持实时代码补全等低延迟任务。特殊版本: 还有针对Python代码进一步微调的Code Llama – Python，以及通过指令微调和对齐的Code Llama – Instruct，以更好地理解人们对提示的期望。如何使用Code Llama？现在，你就可以在 Perplexity 上免费体验： labs.perplexity.ai 选择模型: Code Llama提供了三种大小的模型，分别具有7B、13B和34B参数，以满足不同的服务和延迟要求。代码生成: 可以通过自然语言提示（例如“为我编写一个输出斐波那契序列的函数。”）生成代码。代码补全: 具有填充中间（FIM）功能的7B和13B基础和指导模型可以插入现有代码中的代码，支持代码补全等任务。遵守许可: 在使用Code Llama模型时，用户必须遵守许可和可接受使用政策。 Code Llama的目标是使开发人员的工作流程更高效，使他们能够专注于工作的最人性化方面，而不是重复任务。通过开放的方法，Code Llama有助于促进新技术的发展，改善人们的生活。

Code Llama： Meta AI 推出的免费可商用的AI编程利器
AI视频
- 28
- 0
admin24年7月1日
Imagine with Meta是由Meta发布的独立AI图像生成器，由自家的影像生成模型Emu 支援，可以根据使用者提供的自然语言描述来形成高画质图像，目前已在美国开放一般用户免费使用，每次提示会产生4 张图片提供使用选择。 Meta 指出，将在未来数周内开始为Imagine with Meta 添加不可见的浮水印，以提高AI 生成内容的透明度以及可追溯性，目前仅有一个可见的浮水印。Meta 表示，这些不可见的浮水印是由AI 模型生成，并可透过相应的模型检测到。不过目前并没有公布何时会公开这些检测模型。 Meta 指出，这些浮水印可以在图片被裁剪、调整大小、颜色变化（亮度、对比度等）、萤幕截图、图像压缩、噪点、贴纸覆盖等情况下仍然发挥功能。 Imagine with Meta官网：https://imagine.meta.com/ Imagine with Meta生成的图像示例：

Imagine with Meta：Meta发布的独立AI图像生成器
AI视频
- 22
- 0
admin24年7月1日
周二，Meta 宣布推出 SeamlessM4T，一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络，它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译，支持「最多 100 种语言」，Meta 表示，它的目标是帮助说不同语言的人更有效地交流。继续 Meta 相对开放的人工智能方法，它正在以研究许可（CC BY-NC 4.0）的形式发布 SeamlessM4T，允许开发者在此基础上进行开发。他们还发布了 SeamlessAlign，Meta 称之为「迄今最大的开放式多模式翻译数据集，总共挖掘了 270,000 个小时的语音和文本对齐」。这将有可能启动其他研究人员训练未来翻译人工智能模型的过程。在 Meta 的博客中宣传的 SeamlessM4T 的特性中，该公司表示该模型能够执行语音识别（将语音转换为文本）、语音到文本翻译（将口语音频翻译为不同语言的文本）、语音到语音翻译（提供语音，输出翻译后的语音）以及文本到文本翻译（类似于 Google 翻译的功能）和文本到语音翻译（提供文本，将其翻译并以另一种语言呈现出来）。每个文本翻译功能支持将近 100 种语言，语音输出功能支持大约 36 种输出语言。在 SeamlessM4T 的公告中，Meta 提到了 Babel Fish，一种虚构的鱼，来自道格拉斯·亚当斯经典的科幻小说系列《银河系漫游指南》，它可以立即翻译任何口头语言：构建一个像银河系漫游指南中虚构的 Babel Fish 一样的通用语言翻译器是具有挑战性的，因为现有的语音到语音和语音到文本系统只覆盖了世界上语言的一小部分。但我们相信，我们今天宣布的工作在这一旅程中是向前迈出的重要一步。它们是如何训练的？根据 Seamless4MT 研究报告，Meta 的研究人员「创建了一个多模式语料库，其中含有自动对齐的超过 470,000 个小时的语音翻译，称为 SeamlessAlign」（在前面已经提及）。然后，他们「使用人工标注和伪标注数据对这个语料库的一个子集进行了筛选，总计 406,000 个小时」。与往常一样，Meta 对其训练数据的来源有些含糊。文本数据来自「与 NLLB 中部署的相同数据集」（从维基百科、新闻来源、脚本演讲和其他来源中提取的句子组成，由专业人员翻译）。根据研究论文，SeamlessM4T 的语音数据来自「400 万小时的原始音频，来源于一个公开可用的网络数据库」，其中 100 万小时是英语。Meta 没有具体说明使用哪个存储库或音频剪辑的出处。 Meta 远非第一家提供机器学习翻译工具的人工智能公司。Google 翻译自 2006 年以来就使用机器学习技术，大型语言模型（如 GPT-4）以其在语言之间的翻译能力而闻名。但是，在音频处理方面，最近这项技术变得非常热门。在九月份，OpenAI 发布了自己的开源语音到文本翻译模型，名为 Whisper，它可以在音频中识别语音并将其翻译成文本。 SeamlessM4T 扩展了多语言翻译的趋势，并且 Meta 表示 SeamlessM4T 的「单一系统方法」——一个单一的人工智能模型而不是多个模型组合在一条链上（类似于 Meta 之前的一些音频处理技术）——减少了错误，增加了翻译的效率。关于 SeamlessM4T 如何运作的更多技术细节可以在 Meta 的网站上获得，其代码和权重（实际训练的神经网络文件）可以在 Hugging Face 上找到。

SeamlessM4T：Meta发布的多语言语音翻译模型
AI视频
- 56
- 0
admin24年7月1日
Meta AI 是什么？ Meta AI 是由 Meta（前身为 Facebook）推出的先进人工智能平台。该平台涵盖了多个应用场景和服务，包括自然语言处理、图像识别、以及深度学习等多个方面。 Meta AI 可以做什么？跨平台交互：Meta AI 可以在 WhatsApp、Messenger、Instagram 等多个平台上进行交互，提供实时信息和服务。图像生成与编辑：通过 Restyle 和 Backdrop 等工具，Meta AI 可以进行图像生成和编辑，使用户能够更自由地表达自己。实时信息获取：Meta AI 可以实时访问与 Bing 的搜索合作获得的信息，为用户提供即时的搜索结果和建议。角色互动：Meta AI 还包括 28 个不同的 AI 角色，每个角色都有其独特的背景和个性，为用户提供更多样化的互动体验。 Meta AI 使用场景社交媒体交流：在 WhatsApp、Messenger 或 Instagram 等平台上，用户可以通过 Meta AI 进行更丰富和个性化的交流。创意表达：通过图像生成和编辑工具，用户可以更自由地进行创意表达。信息检索与决策：在需要获取信息或做出决策时，Meta AI 可以提供实时的搜索结果和建议。如何使用 Meta AI？使用 Meta AI 非常简单。在任何支持的平台上，用户都可以通过简单的文本命令或图像上传来与 Meta AI 互动。例如，如果你想了解某个旅行目的地的信息，只需在聊天窗口中输入相应的命令，Meta AI 就会提供相关的信息和建议。了解更多：https://about.fb.com/news/2023/09/introducing-ai-powered-assistants-characters-and-creative-tools/

Meta AI
AI视频
- 20
- 0
admin24年7月1日
Fairy是什么？ Fairy由Meta GenAI开发的用文本语言进行视频编辑的AI工具，你可以用简单的文字描述就对能视频进行风格转换（如将视频转换为梵高、漫画风格）、物体或角色变换（将视频中的物体或角色转换成其他形式）等编辑。 Fairy官方演示视频：更多Fairy演示视频：https://fairy-video2video.github.io/supp/index.html Fairy可以做什么？物体或角色变换：Fairy可以将视频中的特定物体或角色转换成其他形式，例如将人物转换成木雕或金属骑士雕塑。这种编辑涉及到复杂的形状和纹理变化。视频风格转换：Fairy能够将视频中的图像风格转换为不同的艺术风格，例如梵高或毕加索风格。这种转换不仅改变颜色和纹理，还保持视频的原始内容和结构。长视频处理：由于Fairy的高效性和内存管理优势，它能够处理相对较长的视频，而不会遇到内存问题。保留视频细节：在进行风格转换或物体变换时，Fairy能够保留视频中的重要细节，确保编辑后的视频仍然保持高质量和真实感。时间连贯性：Fairy特别注重在编辑过程中保持视频的时间连贯性，确保从一帧到下一帧的过渡自然和流畅。处理高效：Fairy不仅解决了以前模型的内存和处理速度限制，还通过独特的数据增强策略改善了时间一致性。Fairy能够在14秒内生成120帧的512×384视频（4秒时长，30 FPS），比之前的工作快至少44倍。如何使用Fairy？项目地址：https://fairy-video2video.github.io 论文地址：https://arxiv.org/pdf/2312.13834.pdf

Fairy：Meta开发的用语言指令进行视频编辑的AI工具
AI视频
- 23
- 0
admin24年7月1日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部