图像

共 167 篇文章

谷歌Gemini技术报告由900余位作者共同撰写

AIGC动态欢迎阅读原标题:谷歌Gemini技术报告出炉,作者多达900余人关键字:报告,模型,任务,能力,图像文章来源:机器之心内容字数:8711字内容摘要:机器之心最新报道指出,备受瞩目的谷歌Gemini技术报告终于发布。Gemini是一项原生多模态大模型,谷歌宣称其具有超越GPT-4的强大性能...
谷歌Gemini技术报告由900余位作者共同撰写

中途之旅第六季史诗级升级,网友惊呼逼真无比!神秘图像接连曝光,传闻将于明天和后天上线

AIGC 动态欢迎阅读 原标题:Midjourney V6史诗级升级,网友惊呼太逼真!神图接连曝出,传今明两天上线 关键字:目的、细节、效果、网友、图像 文章来源:新智元 内容字数:4055字 新智元报道编辑:Aeneas Midjourney V6 刚刚开启了第二次社区评价,网友们被各种神图震惊到...
中途之旅第六季史诗级升级,网友惊呼逼真无比!神秘图像接连曝光,传闻将于明天和后天上线

2023-2024 年的影像旗舰:它的独特魅力在哪里?

AIGC动态欢迎阅读原标题:2023-2024 年影像旗舰,为何众多选择它?关键字:影像、小米、手机、旗舰、图像文章来源:爱范儿内容字数:6021字内容摘要:影像旗舰第三代骁龙 8 移动平台在10月发布,引发了一系列重大变化:Android 旗舰手机纷纷在2023年第四季度集中发布,竞争异常激烈,一...
2023-2024 年的影像旗舰:它的独特魅力在哪里?

谷歌发布全新视频生成大型语言模型VideoPoet

AI时代新动态 原标题:谷歌推出视频生成巨型语言模型VideoPoet关键词:视频、模型、文本、音频、图像文章来源:AI范儿字数:2042字 内容摘要: 请点击上方链接关注我们。谷歌推出了VideoPoet,这是一款生成式人工智能系统,能够通过文本等输入创建和编辑视频。与其他竞争模型不同,Video...
谷歌发布全新视频生成大型语言模型VideoPoet

Midjourney V6 即将推出,带来多项升级改进

AIGC动态欢迎阅读 原标题:Midjourney V6 即将推出,有许多改进关键字:人工智能,用户,图像,提示,可能会文章来源:AI范儿内容字数:2378字 内容摘要: 点击上方蓝字关注我们。Midjourney即将推出引领潮流的AI艺术工具Midjourney v6,继具有突破性的V5.2之后。...
Midjourney V6 即将推出,带来多项升级改进

SEED-Bench更新:SEED-Bench多模态大模型测评基准超越GPT-4V?

本文介绍了腾讯AI Lab与腾讯ARC Lab和港中深合作推出的SEED-Bench系列测评基准,为多模态大语言模型(MLLM)提供了全面客观的评测体系。SEED-Bench评测基准是一个包含大量经过人工标注正确答案的选择题的评测体系,涵盖了图像和视频等12个维度,而后版本扩充至27个维度。这一评测...
SEED-Bench更新:SEED-Bench多模态大模型测评基准超越GPT-4V?

阿里文生视频挑战Gen-2、Pika,1280×720高清画质流畅播放,3500万像素呈现文本与视频绝佳效果

AIGC动态欢迎阅读 近日,阿里巴巴的研究掀起了文生视频领域的新热潮。一项名为I2VGen-XL的文生视频模型展示了惊人的表现,能够以1280×720分辨率高质量、流畅地生成各类视频,包括艺术画作、人物肖像、动物、科幻图等。其中包含了一些示例文本:“一只小猫在花丛中,中国画。”、“一个黄色的机器人。...
阿里文生视频挑战Gen-2、Pika,1280×720高清画质流畅播放,3500万像素呈现文本与视频绝佳效果

谷歌宣布Gemini API开放,ChatGPT Plus订阅重新启动!

最新动态:AIGC 原标题:谷歌宣布启用Gemini API,ChatGPT Plus订阅重新开放 关键词:图像、开发者、文本、功能、谷歌 引用自:夕小瑶科技 文本长度:5149字 内容概要:夕小瑶科技报道,作者王二狗。人工智能领域的动态异常精彩,OpenAI和谷歌再次展开激烈竞争。Sam Altm...
谷歌宣布Gemini API开放,ChatGPT Plus订阅重新启动!

Nature年度十大科学人物揭晓:ChatGPT榜上有名!

<img src=""> 欢迎阅读AIGC动态 原标题:ChatGPT被列为Nature年度十大科学人物;全国首例AI声音侵权案公开审理;谷歌推出图片生成模型Imagen2丨AIGC大事日报。 关键词:模型,阿里,华为,图像,中文。 文章来源:AI导航。 内容字数:9...
Nature年度十大科学人物揭晓:ChatGPT榜上有名!

谷歌DeepMind最新发布Imagen 2:挑战你的视觉AI识别能力

AIGC动态欢迎阅读原标题:谷歌DeepMind最新发布Imagen 2:这些AI生成的图片是否可以被识别?关键词:图像, 提示, 技术, 文本, 用户文章来源:机器之心内容字数:5104字内容摘要:机器之心的编辑陈萍及大盘鸡报道称,Imagen 2是谷歌最新发布的一款可以生成质量更高、更逼真、更准...
谷歌DeepMind最新发布Imagen 2:挑战你的视觉AI识别能力

Imagen 2登场,正面对决DALL·E 3和Midjourney,谷歌文生图巅峰之战!

在新智元报道中,谷歌最新发布的文生图AI模型Imagen 2引起了广泛关注。根据报道,Imagen 2在生成图像的逼真程度方面表现优秀,甚至超越了之前的DALL·E 3和Midjourney。通过输入具体描述,如“一位32岁的年轻女性自然保护主义者,正在丛林中探险。她体格健壮,一头短卷发,面带亲切的...
Imagen 2登场,正面对决DALL·E 3和Midjourney,谷歌文生图巅峰之战!

谷歌强势入局,AI绘图领域再度卷起波澜

AI绘图领域再掀风潮近日,谷歌强势介入AI绘图领域,再度掀起轩然大波。谷歌推出最新黑科技产品Imagen 2,引领技术革新。这款AI画家具备逼真细节表现能力,包括手部、面部等,同时具备多种画风的创作功能,还加入了图像编辑和扩展功能。安全措施SynthID和水印防篡改功能,有效抵制了图像篡改行为。谷歌...
谷歌强势入局,AI绘图领域再度卷起波澜

三种实现多模态大模型的方法,文末有赠书

AIGC动态欢迎阅读 以下为原标题:大模型+多模态的3种实现方法|文末赠书。 关键词:模型、图像、步骤、任务、数据。 文章来源:AI前线。 内容字数:5975字。 内容摘要:我们都了解,预训练LLM已经取得了许多惊人的成就,然而它明显的劣势在于不支持其他模态(包括图像、语音、视频模态)的输入和输出。...
三种实现多模态大模型的方法,文末有赠书

斯坦福李飞飞合作谷歌,AI文生视频大模型炸圈

欢迎阅读AIGC动态原标题:斯坦福大学李飞飞团队联合谷歌推出AI文生视频大模型关键词:视频, 字节跳动, 模型, 图像, 示例文章来源:AI导航字数:7188字内容摘要:AI文生视频工具的迅速崛起,视频生成模型的GPT时代即将到来。本文报道了斯坦福大学AI科学家李飞飞及其团队与谷歌合作,发布了名为W...
斯坦福李飞飞合作谷歌,AI文生视频大模型炸圈

AI技术娴熟,恶搞不分年龄

欢迎阅读AIGC动态 原文标题:AI技术不断发展,甚至影响到孩子们 关键词:报告,受害者,照片,图像,图片 文章来源:爱范儿 文章字数:7680字 文章摘要:深度伪造技术变得司空见惯。正如电影《心灵奇旅》中所说,当我们在寻找海洋时,可能早已置身水中。人工智能在人类社会中的作用看似也如此。今年以来,各...
AI技术娴熟,恶搞不分年龄

Mamba带火的SSM:苹果、康奈尔开始关注的注意力扩散模型

<img src=""> 《AIGC动态》欢迎阅读 原题目:丢掉注意力的扩散模型:Mamba带火的SSM被苹果、康奈尔盯上了 关键词:模型、架构、注意力、图像、序列 文章来源:机器之心 内容字数:6975字 内容摘要:近日,机器之心报道了一个备受关注的研究,康奈尔大学...
Mamba带火的SSM:苹果、康奈尔开始关注的注意力扩散模型

系统生物学家 Patrick Müller 利用孪生网络研究 AI 如何与斑马鱼胚胎结合

近日,康斯坦茨大学的系统生物学家Patrick Müller领导的研究团队成功利用孪生网络对斑马鱼胚胎展开了研究,这一成果引起了广泛关注。胚胎的发育是一个复杂的过程,其形态随时间不断变化,研究者们希望通过客观的方式来量化这一过程,并提供标准化的方法来分析胚胎的不同发育阶段,以更好地理解进化和发育的过...
系统生物学家 Patrick Müller 利用孪生网络研究 AI 如何与斑马鱼胚胎结合

贾佳亚团队新研究:AI成为鉴片大师,星际穿越也能轻松看懂超长3小时视频

AIGC动态欢迎阅读 本文来源于量子位,介绍了贾佳亚团队最新研究成果:他们开发的多模态大模型LLaMA-VID可以处理超长视频,使得AI能够像专业影评人一样理解电影,比如《星际穿越》,并对电影中的细节进行准确回答。这项研究的背后原理简单却高效,将每一帧图像的表示压缩到仅有2个token。与其他同类模...
贾佳亚团队新研究:AI成为鉴片大师,星际穿越也能轻松看懂超长3小时视频

何恺明联合MIT推出简单框架实现无条件图像生成新SOTA

以下是您要处理的文本内容: 欢迎浏览AIGC最新动态 原文标题:何恺明最新研究成果:简洁框架实现无条件图像生成新纪录!并与麻省理工合作 关键词:图像、条件、表示、团队、模型 文章来源:量子位 内容字数:3534字 内容摘要:知名博主丰色在量子位上报道:即便何恺明尚未正式加入麻省理工,他却已经与该校师...
何恺明联合MIT推出简单框架实现无条件图像生成新SOTA

GTA6预告片播放量突破亿,AI三巨头瞬间变身成GTA匪帮

文章中提到,最新一期的GTA游戏预告片在观看次数上已经破了三项吉尼斯世界纪录,达到了破亿的数量。同时,AI三巨头:Yann LeCun、Geoffrey Hinton 和 Yoshua Bengio 也被合成成GTA游戏人物,展示了AI技术在图像领域的应用潜力。腾讯利用名为FaceStudio的AI...
GTA6预告片播放量突破亿,AI三巨头瞬间变身成GTA匪帮

Google发布最强大的新模型:GPT-4是否将被超越?

最新的 AIGC 动态如下: 随着 Google 推出了多模态 Gemini AI 模型,掀起了一场关于 GPT-4 是否会被反超的讨论。Gemini 能够处理文本、代码、音频、图像和视频等不同类型的信息,被视为 Google 在 AI 大模型领域的重要突破。然而,Google 之前推出的 Bard...
Google发布最强大的新模型:GPT-4是否将被超越?

谷歌DeepMind发布Gemini:史上最强最通用大模型,挑战GPT-4!

AIGC动态欢迎阅读 原标题:超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型! 本文来自夕小瑶科技说,全文共计5651字。夕小瑶科技说的原创作者王二狗深夜透露,谷歌DeepMind最新发布的Gemini大模型堪称谷歌史上功能最强大、最通用的多模态模型,在多项领先基准测...
谷歌DeepMind发布Gemini:史上最强最通用大模型,挑战GPT-4!

Google发布Gemini:新一代超越GPT-4的语言模型

AIGC动态欢迎阅读近日,Google发布了Gemini,这一消息引发了广泛关注。Gemini Pro AI 模型首次亮相于Bard平台,虽然规模较小,却备受期待。与此同时,Google还在提前预热更为庞大的Gemini Ultra模型,预计将超越OpenAI的GPT-4。据Google透露,Gem...
Google发布Gemini:新一代超越GPT-4的语言模型

微软Copilot升级,图文代码能力暴涨,ChatGPT面临失业危机!

AIGC动态欢迎您的阅读原标题:微软Copilot升级,ChatGPT面临失业危机!图文代码能力大幅提升,而且免费关键词:微软、功能、图像、代码、模型文章来源:AI导航内容字数:6016字内容摘要:并非ChatGPT无法承受,而是微软Copilot更具性价比。撰写者:香草 编辑:李水青 摘自AI导航...
微软Copilot升级,图文代码能力暴涨,ChatGPT面临失业危机!

马斯克旗下AI公司xAI计划融资10亿美元,内幕曝光!

欣会AIGC的最新动态近期消息披露,马斯克旗下人工智能公司xAI计划进行高达10亿美元的融资。据称,xAI已经成功筹集了1.347亿美元的股权融资,并计划总额达到10亿美元。这一举动使得现年52岁的马斯克,领导的包括特斯拉、SpaceX、X、Neuralink、Boring Co和xAI在内的六家公...
马斯克旗下AI公司xAI计划融资10亿美元,内幕曝光!

AI扩图离谱之处,让人大开眼界

<img src=""> AIGC动态欢迎阅读 原标题:“离谱的AI扩图”火了!张张那叫一个出其不意。 这篇文章来自量子位,共计4229字。抖音上的AI扩图给人带来了很多意想不到的惊喜。比如,一对恩爱情侣的照片在经过AI扩图处理后,画风完全180度大反转,让人哭笑不得...
AI扩图离谱之处,让人大开眼界

资深学者共同研发的纯CV大模型在UC伯克利呈现通用视觉推理突破

新闻来自机器之心,题为“通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与”。文章介绍了UC伯克利和约翰霍普金斯大学的研究者最新论文中探讨的内容,展示了大型视觉模型(LVM)在多种CV任务中的应用潜力。最近,大型语言模型(LLM)如GPT和LLaMA备受关注,而构建大型视觉模型(LV...
资深学者共同研发的纯CV大模型在UC伯克利呈现通用视觉推理突破

UC伯克利三巨头发布首个纯计算机视觉大模型,引发AGI火花

欢迎阅读AIGC动态 原文标题:UC伯克利的计算机视觉GPT时刻!三位专家推出首个纯视觉大模型,引发人工智能火花 关键词:研究人员,序列,视觉,模型,图像 文章来源:新智元 内容字数:16210字 新智元报道编辑:编辑部【新智元导读】UC伯克利的计算机视觉三位专家共同推出了首个无自然语言的纯视觉大模...
UC伯克利三巨头发布首个纯计算机视觉大模型,引发AGI火花

COLE:人工智能生成可编辑设计,再见平面设计师?

《AIGC动态欢迎阅读》 原标题:再见,平面设计师?COLE 结合多个人工智能,按需生成可编辑设计 关键词:平面设计,文本,图像,研究人员,工具 文章来源:AI范儿 内容字数:2261字 内容摘要:COLE是一款潜力巨大的平面设计工具,能够通过输入文本提示生成高质量设计,并具有可编辑文本和图像对象的...
COLE:人工智能生成可编辑设计,再见平面设计师?

《古墓丽影》初代劳拉的“真人”原型曝光

文章介绍了一个名为Magnific AI的超分辨率图像增强应用,在重新绘制经典游戏《古墓丽影》中的像素风角色时展现出了惊人的效果。通过AI的优化,原本模糊、缺乏细节的图像得以精细化处理,呈现出高清的效果。这种应用还可以将低清主角和风景画进行转化,使得每一个细节都清晰可见。除了《古墓丽影》之外,文章还...
《古墓丽影》初代劳拉的“真人”原型曝光

梢露化身爱因斯坦?AI视觉字谜狂欢中!英伟达高级科学家称其为最火扩散模型

近日,AI视觉字谜引发热议,一幅画在社交媒体上爆火。画中玛丽莲·梦露被倒转180°后竟变成了爱因斯坦!这项研究源自密歇根大学,被英伟达高级AI科学家Jim Fan誉为“近期最酷的扩散模型”。人们惊叹AI在绘画中的表现,截然不同的提示词能让AI绘出不同主题,甚至将单词进行旋转处理也展现出新效果。这种视...
梢露化身爱因斯坦?AI视觉字谜狂欢中!英伟达高级科学家称其为最火扩散模型

梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

在最近的一篇机器之心文章中,报道了来自阿里的研究团队提出的一项名为“Animate Anyone”的方法。这种方法只需要一张人物照片,再配合骨骼动画引导,就可以生成动画视频。最近,某舞蹈动作“科目三”在网络上掀起了一阵热潮,许多人模仿其摇花手、半崴不崴的脚步,并配以明快的音乐节奏。如果让人工智能生成...
梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

ChatGPT提示词新玩法:让创造更生动,文本与图像效果倍增

AIGC动态欢迎阅读 原标题:ChatGPT提示词新玩法「make it more」,文生图效果翻倍 关键词:提示、图像、汉堡包、音乐会、文本 文章来源:机器之心 内容字数:2359字 内容摘要:杜伟编辑的机器之心报道。ChatGPT提示词技巧非常实用,尤其在文生图任务中,利用提示词技巧十分重要。近...
ChatGPT提示词新玩法:让创造更生动,文本与图像效果倍增
1 2 3 5