-
GPT-4-OpenAI旗下AI大模型
7月7日,AIHub最新消息:所有具有成功付款历史的现有 API 开发人员都可以访问具有 8K 上下文的 GPT-4 API。 GPT-4是什么? GPT-4是OpenAI的大型语言模型的最新版本,是目前最先进的系统,能够产生更安全、更有用的回应。它能够解决更困难的问题,准确度更高,这要归功于它更广泛的一般知识和问题解决能力。 它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它…
-
澜舟科技-孟子大模型
孟子大模型是什么? 孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。 官网:https://www.langboat.com/portal/mengzi-model 孟子大模型可以做什么? 孟子预训练模型提供了一系列产品,包括孟子生成式大模型(孟子 GPT)、Mengzi-BERT-base、Meng…
-
浦语灵笔-上海AI实验室开源图文混合创作大模型
浦语灵笔是什么? 上海人工智能实验室(上海AI实验室)近日推出了首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。 浦语灵笔是基于书生·浦语大语言模型(InternLM)的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B(InterLM-7B)及20B(Inter…
-
携程问道:首个旅游行业垂直AI大模型
7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户提出想法,问道可从地域、主题特色等维度,推荐旅行目的地、酒店、景点、行程规划和实时优惠的选项; 在用户需求相对明确时,提供智能查询结果,用户可用文字和语音以自然语言长句的形式进行复杂条件的机票和酒店产…
-
彭博社-BloombergGPT金融大模型
BloombergGPT是什么? 根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。 报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。 一般来说,…
-
Ferret-UI:苹果公司推出的多模态AI模型
Ferret-UI是什么? Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并执行任务,聚焦于移动端、关注用户交互。 论文链接:https://arxiv.org/pdf/2404.05719.pdf Ferret-UI主要功能特性 多模态理解能力:…
-
TableGPT:浙江大学发布的表格大模型
TableGPT是什么? TableGPT是一个统一的微调框架,使大模型(LLM)能够使用外部功能命令理解和操作表格,旨在通过使用户能够轻松利用表格数据来为用户提供便利和可访问性。 TableGPT 的核心在于全局表格表示的新颖概念,它使大模型(LLM)能够全面了解元信息之外的整个表格。通过联合训练表格和文本模式的大模型(LLM),TableGPT 实现了对表格数据的深入理解以及通过命令链指令对表…
-
Meta-ImageBind开源多模态AI大模型
ImageBind是什么? AIHub最新消息,Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。同时,该模型也表明了 Meta 公司在人工智能研究领域的开放态度,而…
-
PowerLawGLM-法律垂直AI大模型
PowerLawGLM是什么? "PowerLawGLM"是由幂律智能联合智谱AI发布的千亿参数级法律垂直大模型。这个模型专注于法律细分领域,针对中文法律场景的应用效果具有独特优势,具备丰富的法律知识和法律语言理解能力。 基于PowerLawGLM推出了法律对话产品ChatMe,已正式上线。 ChatMe申请地址:https://jinshuju.net/f/wvpvKk Po…
-
通义千问-阿里云AI大模型
通义千问是什么? 通义千问是一个由阿里云提供的大型语言模型,专门响应人类的指令来提供帮助。该模型可以在多个方面提供支持,包括创意文案编写、生活娱乐建议、学习辅导和办公助理服务等。它可以帮助用户编写情书、润色文案、提供学习解题思路和助力提高工作效率等。 AIHub获悉,今天,阿里云于微信公众号宣布通义千问大模型已首批通过备案,并正式向公众开放,用户可登录通义千问官网体验,企业用户可以通过阿里云调用通…
-
Monkey:华中科技大学开源的多模态大模型
Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。 Monkey 的多级描述生成方法可以为模型提供丰富的上下文信息,指导模型学习场景和对象之间的关联。通过在16个不同的数据集上进行测试,Monkey 在图…
-
阅文妙笔大模型:国内首个网文大模型
在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。 阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能”。 侯晓楠将 AIGC 对作家的意义比作“从手动驾驶升级到辅助驾驶”。他介绍称,“阅文妙笔”将通过内容灵感、场景创作、知识服务等创作辅助,为作家节约大量冗余、枯燥的工作。 其称,AIGC 开启了新…
-
Gemini-谷歌发布的多模态AI大模型
Google Gemini是什么? AIHub 12 月 6 日消息,谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态大模型Gemini。意味着它可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。 根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了「最先进的性能」,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。 Google官方介绍视频 G…
-
妙话AI-AI聊天、写作、绘画一站式AI应用平台
妙话AI是什么? 妙话AI是一个在线智能写作应用,它提供了多种功能,包括自动生成绘画、语音对话机器人等。这个平台集成了100多个智能AI大模型,用户可以通过一键操作进行聊天、写作、绘画和语音生成,轻松解决复杂问题。 产品官网:https://imiaohua.com 妙话AI的主要功能 以下是妙话AI的一些主要功能和特点: 多模型PK:用户可以选择不同的AI模型进行对话,比较它们的性能。 AI绘图…
-
CodeShell-北京大学开源的代码大模型
CodeShell是什么? CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座。CodeShell具有70亿参数,在五千亿Tokens进行了训练,上下文窗口长度为8192。在权威的代码评估Benchmark(HumanEval与MBPP)上,CodeShell取得同等规模最好的性能。 CodeShell代码:https://github.com/Wisdo…
-
Gemma-谷歌发布的最新开放模型,小尺寸可商用
Gemma是什么? Gemma是谷歌最新发布的一款轻量级开放模型,它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。Gemma是由Google DeepMind和Google其他团队合作开发的,并用拉丁语中意为“宝石”的gemma为其命名。 Gemma共有两个版本:Gemma 2B(20亿参数)和Gemma 7B(70亿参数),每种规模都提供了预训练和指令微调版本。这些模型…
-
金蝶云·苍穹GPT
金蝶云·苍穹GPT是什么? 金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。 金蝶云官网:https://www.kingdee.com/ 金蝶云·苍穹GPT可以做什么? 金蝶云·苍穹GPT在多模型能力…
-
悬河- AI机器人和AI虚拟人聊天平台
悬河是什么? 悬河是一个提供AI机器人聊天和AI虚拟人聊天服务的平台,它允许用户与各种虚构的角色进行互动。这些角色可能来自于不同的领域,如影视综艺、游戏、动漫、历史人物、网络小说、网络红人等。用户可以通过与这些AI角色的交流来体验不同的故事情节,享受互动的乐趣。 悬河官网 悬河的主要功能 你可以在平台免费创建自己喜欢的AI虚拟角色,并与其进行社交聊天。 同时,您也可以浏览平台上海量的UGC虚拟角色…
-
中科院自动化研究所-紫东太初大模型
紫东太初大模型 “紫东太初”跨模态通用人工智能平台是由中国科学院自动化研究所研发的以多模态大模型为核心、基于全栈国产化基础软硬件平台,可支撑全场景AI应用。 依托面向超大规模的高效分布式训练框架,自动化所构建了具有业界领先性能的中文预训练模型、语音预训练模型、视觉预训练模型,并开拓性地通过跨模态语义关联实现了视觉-文本-语音三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核…
-
Octopus V2-斯坦福推出的可在设备上运行的大模型
Octopus v2是什么? Octopus v2是由斯坦福大学研究团队最近推出的可在设备上运行的端侧AI模型,引起了开发者社区的广泛关注,一夜之间下载量超过了2000次。Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了3…
-
元象大模型
元象信息科技有限公司(元象 XVERSE)宣布,元象大模型将向全社会开放服务。 元象大模型是元象从头训练、全链路自主研发的高性能通用大模型系列,具备优秀的中文创作、逻辑推理和任务执行能力。 元象 XVERSE成功研发了 XVERSE-7B、13B、65B 等多个量级的高性能大模型,并全部开源并免费商用,填补了中文大模型开源生态的空白。他们的大模型具有优秀的性能,显著提升了基础能力、工具调用能力,并…
-
TripoSR - 单张图片快速生成高质量3D模型
TripoSR是什么? TripoSR是由Stability AI 和国内AI企业VAST合作开源的快速3D物体重建模型,能在1秒内从单张2D图像快速生成高质量的3D模型。 这项技术利用先进的人工智能算法,通过分析图片内容,自动创建出相应的三维模型。TripoSR的目标是简化3D建模过程,使得用户即使没有专业的3D建模技能,也能够轻松地从现有的2D图像中创建出3D内容。 TripoSR的主要特性:…
-
Ferret:苹果发布的多模态大语言模型
Ferret是什么? Ferret是苹果公司开发的端到端机器学习语言模型,Ferret不仅可以准确识别图像并描述其内容,还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。Ferret结合了混合区域表示和空间感知的视觉采样器,使得在MLLM中实现细粒度和开放词汇的指代和定位成为可能。 Ferret拥有7B和13B两个版本,为了增强 Fer…
-
火山方舟-火山引擎AI大模型平台
火山方舟是什么? 火山方舟是一个开放的大模型生态平台,它提供了一系列功能,包括模型广场、模型体验、模型训练推理和模型应用。这个平台旨在加速大模型能力渗透到千行百业,助力模型提供方和使用者实现商业新增长。 了解更多:https://www.volcengine.com/product/ark 火山方舟可以做什么? 模型广场:用户可以在模型广场上查看所有模型提供方上架在平台上的大模型。 模型体验:用户…