图像

共 167 篇文章

Midjourney V6发布全新版本！生图效果超越DALL·E3，逼真画面光影细节达到巅峰

AIGC动态欢迎阅读原标题：Midjourney V6神图炸出！生图效果碾压DALL·E3，逼真画面光影细节登峰造极关键字：光影,效果,网友,人物,图像文章来源：新智元内容字数：10001字内容摘要：新智元报道编辑：编辑部【新智元导读】Midjourney V6昨天突然发布，带来了一波神图纷纷炸出，...

AI工具箱3年前

Midjourney V6发布全新版本！生图效果超越DALL·E3，逼真画面光影细节达到巅峰

Midjourney 公布 V6 beta 版本：升级语义理解功能，新增英文单词嵌入支持

AIGC动态欢迎您的阅读原标题：Midjourney发布V6 beta版本：增强语义理解，支持嵌入英文单词关键词：公告，语义，图像，模型，细节文章来源：Founder Park内容字数：5067字内容摘要：在圣诞节假期来临之际，Midjourney发布了V6 beta版本。北京时间下午13:5...

AI工具箱3年前

Midjourney 公布 V6 beta 版本：升级语义理解功能，新增英文单词嵌入支持

谷歌Gemini技术报告由900余位作者共同撰写

AIGC动态欢迎阅读原标题：谷歌Gemini技术报告出炉，作者多达900余人关键字：报告,模型,任务,能力,图像文章来源：机器之心内容字数：8711字内容摘要：机器之心最新报道指出，备受瞩目的谷歌Gemini技术报告终于发布。Gemini是一项原生多模态大模型，谷歌宣称其具有超越GPT-4的强大性能...

AI工具箱3年前

谷歌Gemini技术报告由900余位作者共同撰写

中途之旅第六季史诗级升级，网友惊呼逼真无比！神秘图像接连曝光，传闻将于明天和后天上线

AIGC 动态欢迎阅读原标题：Midjourney V6史诗级升级，网友惊呼太逼真！神图接连曝出，传今明两天上线关键字：目的、细节、效果、网友、图像文章来源：新智元内容字数：4055字新智元报道编辑：Aeneas Midjourney V6 刚刚开启了第二次社区评价，网友们被各种神图震惊到...

AI工具箱3年前

中途之旅第六季史诗级升级，网友惊呼逼真无比！神秘图像接连曝光，传闻将于明天和后天上线

2023-2024 年的影像旗舰：它的独特魅力在哪里？

AIGC动态欢迎阅读原标题：2023-2024 年影像旗舰，为何众多选择它？关键字：影像、小米、手机、旗舰、图像文章来源：爱范儿内容字数：6021字内容摘要：影像旗舰第三代骁龙 8 移动平台在10月发布，引发了一系列重大变化：Android 旗舰手机纷纷在2023年第四季度集中发布，竞争异常激烈，一...

AI工具箱3年前

2023-2024 年的影像旗舰：它的独特魅力在哪里？

谷歌发布全新视频生成大型语言模型VideoPoet

AI时代新动态原标题：谷歌推出视频生成巨型语言模型VideoPoet关键词：视频、模型、文本、音频、图像文章来源：AI范儿字数：2042字内容摘要：请点击上方链接关注我们。谷歌推出了VideoPoet，这是一款生成式人工智能系统，能够通过文本等输入创建和编辑视频。与其他竞争模型不同，Video...

AI工具箱3年前

谷歌发布全新视频生成大型语言模型VideoPoet

Midjourney V6 即将推出，带来多项升级改进

AIGC动态欢迎阅读原标题：Midjourney V6 即将推出，有许多改进关键字：人工智能,用户,图像,提示,可能会文章来源：AI范儿内容字数：2378字内容摘要：点击上方蓝字关注我们。Midjourney即将推出引领潮流的AI艺术工具Midjourney v6，继具有突破性的V5.2之后。...

AI工具箱3年前

Midjourney V6 即将推出，带来多项升级改进

SEED-Bench更新：SEED-Bench多模态大模型测评基准超越GPT-4V？

本文介绍了腾讯AI Lab与腾讯ARC Lab和港中深合作推出的SEED-Bench系列测评基准，为多模态大语言模型（MLLM）提供了全面客观的评测体系。SEED-Bench评测基准是一个包含大量经过人工标注正确答案的选择题的评测体系，涵盖了图像和视频等12个维度，而后版本扩充至27个维度。这一评测...

AI工具箱3年前

SEED-Bench更新：SEED-Bench多模态大模型测评基准超越GPT-4V？

阿里文生视频挑战Gen-2、Pika，1280×720高清画质流畅播放，3500万像素呈现文本与视频绝佳效果

AIGC动态欢迎阅读近日，阿里巴巴的研究掀起了文生视频领域的新热潮。一项名为I2VGen-XL的文生视频模型展示了惊人的表现，能够以1280×720分辨率高质量、流畅地生成各类视频，包括艺术画作、人物肖像、动物、科幻图等。其中包含了一些示例文本：“一只小猫在花丛中，中国画。”、“一个黄色的机器人。...

AI工具箱3年前

阿里文生视频挑战Gen-2、Pika，1280×720高清画质流畅播放，3500万像素呈现文本与视频绝佳效果

谷歌宣布Gemini API开放，ChatGPT Plus订阅重新启动！

最新动态：AIGC 原标题：谷歌宣布启用Gemini API，ChatGPT Plus订阅重新开放关键词：图像、开发者、文本、功能、谷歌引用自：夕小瑶科技文本长度：5149字内容概要：夕小瑶科技报道，作者王二狗。人工智能领域的动态异常精彩，OpenAI和谷歌再次展开激烈竞争。Sam Altm...

AI工具箱3年前

谷歌宣布Gemini API开放，ChatGPT Plus订阅重新启动！

Nature年度十大科学人物揭晓：ChatGPT榜上有名！

<img src=""> 欢迎阅读AIGC动态原标题：ChatGPT被列为Nature年度十大科学人物；全国首例AI声音侵权案公开审理；谷歌推出图片生成模型Imagen2丨AIGC大事日报。关键词：模型，阿里，华为，图像，中文。文章来源：AI导航。内容字数：9...

AI工具箱3年前

Nature年度十大科学人物揭晓：ChatGPT榜上有名！

Imagen 2 发行啦！Gemini Pro 免费试用，Duet AI 代码平台正式上线，本周谷歌大爆发

<img src=""> AIGC动态欢迎阅读文章标题：谷歌本周大爆发，Imagen 2发布，Gemini Pro免费体验，代码平台Duet AI上线关键词：图像、模型、代码、开发者、数据文章来源：Founder Park 文章字数：7969字内容摘要：上周谷...

AI工具箱3年前

Imagen 2 发行啦！Gemini Pro 免费试用，Duet AI 代码平台正式上线，本周谷歌大爆发

谷歌DeepMind最新发布Imagen 2：挑战你的视觉AI识别能力

AIGC动态欢迎阅读原标题：谷歌DeepMind最新发布Imagen 2：这些AI生成的图片是否可以被识别？关键词：图像, 提示, 技术, 文本, 用户文章来源：机器之心内容字数：5104字内容摘要：机器之心的编辑陈萍及大盘鸡报道称，Imagen 2是谷歌最新发布的一款可以生成质量更高、更逼真、更准...

AI工具箱3年前

谷歌DeepMind最新发布Imagen 2：挑战你的视觉AI识别能力

Imagen 2登场，正面对决DALL·E 3和Midjourney，谷歌文生图巅峰之战！

在新智元报道中，谷歌最新发布的文生图AI模型Imagen 2引起了广泛关注。根据报道，Imagen 2在生成图像的逼真程度方面表现优秀，甚至超越了之前的DALL·E 3和Midjourney。通过输入具体描述，如“一位32岁的年轻女性自然保护主义者，正在丛林中探险。她体格健壮，一头短卷发，面带亲切的...

AI工具箱3年前

Imagen 2登场，正面对决DALL·E 3和Midjourney，谷歌文生图巅峰之战！

谷歌强势入局，AI绘图领域再度卷起波澜

AI绘图领域再掀风潮近日，谷歌强势介入AI绘图领域，再度掀起轩然大波。谷歌推出最新黑科技产品Imagen 2，引领技术革新。这款AI画家具备逼真细节表现能力，包括手部、面部等，同时具备多种画风的创作功能，还加入了图像编辑和扩展功能。安全措施SynthID和水印防篡改功能，有效抵制了图像篡改行为。谷歌...

AI工具箱3年前

谷歌强势入局，AI绘图领域再度卷起波澜

三种实现多模态大模型的方法，文末有赠书

AIGC动态欢迎阅读以下为原标题：大模型+多模态的3种实现方法｜文末赠书。关键词：模型、图像、步骤、任务、数据。文章来源：AI前线。内容字数：5975字。内容摘要：我们都了解，预训练LLM已经取得了许多惊人的成就，然而它明显的劣势在于不支持其他模态（包括图像、语音、视频模态）的输入和输出。...

AI工具箱3年前

三种实现多模态大模型的方法，文末有赠书

Transformer技术助力扩散模型：AI视频生成质量达到照片级真实感

<img src=""> 欢迎阅读AIGC动态原文标题：Transformer在扩散模型中的应用，AI生成视频达到照片级真实感关键词：视频, 模型, 注意力, 图像, 报告文章来源：机器之心内容字数：9333字内容摘要：机器之心报道编辑：Panda指出，将T...

AI工具箱3年前

Transformer技术助力扩散模型：AI视频生成质量达到照片级真实感

斯坦福李飞飞合作谷歌，AI文生视频大模型炸圈

欢迎阅读AIGC动态原标题：斯坦福大学李飞飞团队联合谷歌推出AI文生视频大模型关键词：视频, 字节跳动, 模型, 图像, 示例文章来源：AI导航字数：7188字内容摘要：AI文生视频工具的迅速崛起，视频生成模型的GPT时代即将到来。本文报道了斯坦福大学AI科学家李飞飞及其团队与谷歌合作，发布了名为W...

AI工具箱3年前

斯坦福李飞飞合作谷歌，AI文生视频大模型炸圈

AI技术娴熟，恶搞不分年龄

欢迎阅读AIGC动态原文标题：AI技术不断发展，甚至影响到孩子们关键词：报告,受害者,照片,图像,图片文章来源：爱范儿文章字数：7680字文章摘要：深度伪造技术变得司空见惯。正如电影《心灵奇旅》中所说，当我们在寻找海洋时，可能早已置身水中。人工智能在人类社会中的作用看似也如此。今年以来，各...

AI工具箱3年前

AI技术娴熟，恶搞不分年龄

Mamba带火的SSM：苹果、康奈尔开始关注的注意力扩散模型

<img src=""> 《AIGC动态》欢迎阅读原题目：丢掉注意力的扩散模型：Mamba带火的SSM被苹果、康奈尔盯上了关键词：模型、架构、注意力、图像、序列文章来源：机器之心内容字数：6975字内容摘要：近日，机器之心报道了一个备受关注的研究，康奈尔大学...

AI工具箱3年前

Mamba带火的SSM：苹果、康奈尔开始关注的注意力扩散模型

系统生物学家 Patrick Müller 利用孪生网络研究 AI 如何与斑马鱼胚胎结合

近日，康斯坦茨大学的系统生物学家Patrick Müller领导的研究团队成功利用孪生网络对斑马鱼胚胎展开了研究，这一成果引起了广泛关注。胚胎的发育是一个复杂的过程，其形态随时间不断变化，研究者们希望通过客观的方式来量化这一过程，并提供标准化的方法来分析胚胎的不同发育阶段，以更好地理解进化和发育的过...

AI工具箱3年前

系统生物学家 Patrick Müller 利用孪生网络研究 AI 如何与斑马鱼胚胎结合

贾佳亚团队新研究：AI成为鉴片大师，星际穿越也能轻松看懂超长3小时视频

AIGC动态欢迎阅读本文来源于量子位，介绍了贾佳亚团队最新研究成果：他们开发的多模态大模型LLaMA-VID可以处理超长视频，使得AI能够像专业影评人一样理解电影，比如《星际穿越》，并对电影中的细节进行准确回答。这项研究的背后原理简单却高效，将每一帧图像的表示压缩到仅有2个token。与其他同类模...

AI工具箱3年前

贾佳亚团队新研究：AI成为鉴片大师，星际穿越也能轻松看懂超长3小时视频

何恺明联合MIT推出简单框架实现无条件图像生成新SOTA

以下是您要处理的文本内容：欢迎浏览AIGC最新动态原文标题：何恺明最新研究成果：简洁框架实现无条件图像生成新纪录！并与麻省理工合作关键词：图像、条件、表示、团队、模型文章来源：量子位内容字数：3534字内容摘要：知名博主丰色在量子位上报道：即便何恺明尚未正式加入麻省理工，他却已经与该校师...

AI工具箱3年前

何恺明联合MIT推出简单框架实现无条件图像生成新SOTA

GTA6预告片播放量突破亿，AI三巨头瞬间变身成GTA匪帮

文章中提到，最新一期的GTA游戏预告片在观看次数上已经破了三项吉尼斯世界纪录，达到了破亿的数量。同时，AI三巨头：Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio 也被合成成GTA游戏人物，展示了AI技术在图像领域的应用潜力。腾讯利用名为FaceStudio的AI...

AI工具箱3年前

GTA6预告片播放量突破亿，AI三巨头瞬间变身成GTA匪帮

Google发布最强大的新模型：GPT-4是否将被超越？

最新的 AIGC 动态如下：随着 Google 推出了多模态 Gemini AI 模型，掀起了一场关于 GPT-4 是否会被反超的讨论。Gemini 能够处理文本、代码、音频、图像和视频等不同类型的信息，被视为 Google 在 AI 大模型领域的重要突破。然而，Google 之前推出的 Bard...

AI工具箱3年前

Google发布最强大的新模型：GPT-4是否将被超越？

谷歌DeepMind发布Gemini：史上最强最通用大模型，挑战GPT-4！

AIGC动态欢迎阅读原标题：超越GPT-4！谷歌DeepMind重磅发布Gemini，史上最强最通用大模型！本文来自夕小瑶科技说，全文共计5651字。夕小瑶科技说的原创作者王二狗深夜透露，谷歌DeepMind最新发布的Gemini大模型堪称谷歌史上功能最强大、最通用的多模态模型，在多项领先基准测...

AI工具箱3年前

谷歌DeepMind发布Gemini：史上最强最通用大模型，挑战GPT-4！

Google发布Gemini：新一代超越GPT-4的语言模型

AIGC动态欢迎阅读近日，Google发布了Gemini，这一消息引发了广泛关注。Gemini Pro AI 模型首次亮相于Bard平台，虽然规模较小，却备受期待。与此同时，Google还在提前预热更为庞大的Gemini Ultra模型，预计将超越OpenAI的GPT-4。据Google透露，Gem...

AI工具箱3年前

Google发布Gemini：新一代超越GPT-4的语言模型

小模型也能”无所不能”：Meta将SAM改进，参数仅为原版的5%

<img src=""> 欢迎阅读AIGC动态原标题：小模型也能实现“分割一切”，Meta改良SAM，仅使用原版5%的参数关键词：编码器、图像、模型、特征、任务文章来源：机器之心内容字数：6437字内容摘要：机器之心编辑报道：陈萍、蛋酱。对于2023年的计算...

AI工具箱3年前

小模型也能”无所不能”：Meta将SAM改进，参数仅为原版的5%

微软Copilot升级，图文代码能力暴涨，ChatGPT面临失业危机！

AIGC动态欢迎您的阅读原标题：微软Copilot升级，ChatGPT面临失业危机！图文代码能力大幅提升，而且免费关键词：微软、功能、图像、代码、模型文章来源：AI导航内容字数：6016字内容摘要：并非ChatGPT无法承受，而是微软Copilot更具性价比。撰写者：香草编辑：李水青摘自AI导航...

AI工具箱3年前

微软Copilot升级，图文代码能力暴涨，ChatGPT面临失业危机！

马斯克旗下AI公司xAI计划融资10亿美元，内幕曝光！

欣会AIGC的最新动态近期消息披露，马斯克旗下人工智能公司xAI计划进行高达10亿美元的融资。据称，xAI已经成功筹集了1.347亿美元的股权融资，并计划总额达到10亿美元。这一举动使得现年52岁的马斯克，领导的包括特斯拉、SpaceX、X、Neuralink、Boring Co和xAI在内的六家公...

AI工具箱3年前

马斯克旗下AI公司xAI计划融资10亿美元，内幕曝光！

AI扩图离谱之处，让人大开眼界

<img src=""> AIGC动态欢迎阅读原标题：“离谱的AI扩图”火了！张张那叫一个出其不意。这篇文章来自量子位，共计4229字。抖音上的AI扩图给人带来了很多意想不到的惊喜。比如，一对恩爱情侣的照片在经过AI扩图处理后，画风完全180度大反转，让人哭笑不得...

AI工具箱3年前

AI扩图离谱之处，让人大开眼界

资深学者共同研发的纯CV大模型在UC伯克利呈现通用视觉推理突破

新闻来自机器之心，题为“通用视觉推理显现，UC伯克利炼出单一纯CV大模型，三位资深学者参与”。文章介绍了UC伯克利和约翰霍普金斯大学的研究者最新论文中探讨的内容，展示了大型视觉模型（LVM）在多种CV任务中的应用潜力。最近，大型语言模型（LLM）如GPT和LLaMA备受关注，而构建大型视觉模型（LV...

AI工具箱3年前

资深学者共同研发的纯CV大模型在UC伯克利呈现通用视觉推理突破

哈工深发布多模态大模型「九天」，性能直升5%，横扫13个视觉语言任务!

<img src=""> 阅读AIGC动态的最新消息近日，哈工深发布了名为「九天」的多模态大模型，在13个视觉语言任务上取得令人瞩目的进展，性能提升了5%。这一成果融合了细粒度空间感知和高层语义视觉知识，为多模态大语言模型领域带来了新的突破。该研究由哈尔滨工业大学...

AI工具箱3年前

哈工深发布多模态大模型「九天」，性能直升5%，横扫13个视觉语言任务!

UC伯克利三巨头发布首个纯计算机视觉大模型，引发AGI火花

欢迎阅读AIGC动态原文标题：UC伯克利的计算机视觉GPT时刻！三位专家推出首个纯视觉大模型，引发人工智能火花关键词：研究人员，序列，视觉，模型，图像文章来源：新智元内容字数：16210字新智元报道编辑：编辑部【新智元导读】UC伯克利的计算机视觉三位专家共同推出了首个无自然语言的纯视觉大模...

AI工具箱3年前

UC伯克利三巨头发布首个纯计算机视觉大模型，引发AGI火花

COLE：人工智能生成可编辑设计，再见平面设计师？

《AIGC动态欢迎阅读》原标题：再见，平面设计师？COLE 结合多个人工智能，按需生成可编辑设计关键词：平面设计，文本，图像，研究人员，工具文章来源：AI范儿内容字数：2261字内容摘要：COLE是一款潜力巨大的平面设计工具，能够通过输入文本提示生成高质量设计，并具有可编辑文本和图像对象的...

AI工具箱3年前

COLE：人工智能生成可编辑设计，再见平面设计师？

《古墓丽影》初代劳拉的“真人”原型曝光

文章介绍了一个名为Magnific AI的超分辨率图像增强应用，在重新绘制经典游戏《古墓丽影》中的像素风角色时展现出了惊人的效果。通过AI的优化，原本模糊、缺乏细节的图像得以精细化处理，呈现出高清的效果。这种应用还可以将低清主角和风景画进行转化，使得每一个细节都清晰可见。除了《古墓丽影》之外，文章还...

AI工具箱3年前

《古墓丽影》初代劳拉的“真人”原型曝光

梢露化身爱因斯坦？AI视觉字谜狂欢中！英伟达高级科学家称其为最火扩散模型

近日，AI视觉字谜引发热议，一幅画在社交媒体上爆火。画中玛丽莲·梦露被倒转180°后竟变成了爱因斯坦！这项研究源自密歇根大学，被英伟达高级AI科学家Jim Fan誉为“近期最酷的扩散模型”。人们惊叹AI在绘画中的表现，截然不同的提示词能让AI绘出不同主题，甚至将单词进行旋转处理也展现出新效果。这种视...

AI工具箱3年前

梢露化身爱因斯坦？AI视觉字谜狂欢中！英伟达高级科学家称其为最火扩散模型

梅西、钢铁侠、二次元姐纷纷挑战「科目三」，引发全网模仿狂潮

在最近的一篇机器之心文章中，报道了来自阿里的研究团队提出的一项名为“Animate Anyone”的方法。这种方法只需要一张人物照片，再配合骨骼动画引导，就可以生成动画视频。最近，某舞蹈动作“科目三”在网络上掀起了一阵热潮，许多人模仿其摇花手、半崴不崴的脚步，并配以明快的音乐节奏。如果让人工智能生成...

AI工具箱3年前

梅西、钢铁侠、二次元姐纷纷挑战「科目三」，引发全网模仿狂潮

中国团队发布开源图文数据集ShareGPT4V，多模态性能实现质的飞跃

<img src=""> AIGC动态欢迎阅读原标题：中国团队开源大规模高质量图文数据集ShareGPT4V，超越同级7B模型，极大提升多模态性能。关键词：数据、模型、图像、文本、画作。文章来源：新智元。内容字数：7209字。内容摘要：研究人员利用GPT4-...

AI工具箱3年前

中国团队发布开源图文数据集ShareGPT4V，多模态性能实现质的飞跃

ChatGPT提示词新玩法：让创造更生动，文本与图像效果倍增

AIGC动态欢迎阅读原标题：ChatGPT提示词新玩法「make it more」，文生图效果翻倍关键词：提示、图像、汉堡包、音乐会、文本文章来源：机器之心内容字数：2359字内容摘要：杜伟编辑的机器之心报道。ChatGPT提示词技巧非常实用，尤其在文生图任务中，利用提示词技巧十分重要。近...

AI工具箱3年前

ChatGPT提示词新玩法：让创造更生动，文本与图像效果倍增

1 2 3 … 5