AI产品

共 186 篇文章

AingDesk

AingDesk是一款开源客户端软件,旨在帮助用户轻松将数百种AI模型快速部署到个人电脑上。其一键部署功能使用户无需具备专业技术背景,即可完成复杂模型的安装过程。此外,AingDesk还具备联网搜索功能,可以通过百度、搜狗等搜索引擎获取实时信息,提高AI回答的准确性与时效性。用户可以利用模型共享功能...
AingDesk

问小白PPT

问小白PPT生成 – 一键生成PPT服务的便捷选择 问小白PPT生成简介 问小白PPT生成是由问小白与AiPPT联合推出的一项快捷的PPT生成服务。用户只需提供所需的大纲或主题,平台即可快速生成完整的PPT文件,并支持免费下载。该服务基于DeepSeek R1 671B满血版,具有高稳定性和零延迟。...
问小白PPT

吐司AI换脸

吐司AI换脸是由吐司TusiArt平台推出的一款先进的AI人像换脸工具,利用ComfyUI Workflow图像处理技术,致力于实现快速且高质量的人像换脸效果。用户只需上传目标图像和需要替换的面部图像,通过简单操作即可完成换脸,生成自然且真实的效果。工具提供精细化的遮罩处理,增强换脸效果的真实感。最...
吐司AI换脸

memobase

memobase 是一个开源的长期记忆系统,专注于用户画像,旨在为生成式人工智能(GenAI)应用提供支持。该系统赋予虚拟助手和教育工具等应用用户记忆的能力,帮助人工智能有效地记住、理解用户,并与之共同成长。memobase 通过结构化的用户信息存储,提供时间感知的记忆功能、灵活的配置选项以及高效的...
memobase

MME-CoT

MME-CoT是一项由香港中文大学(深圳)、香港中文大学、字节跳动、学、上海人工智能实验室、宾夕法尼亚大学及清华大学等多家机构共同开发的基准测试框架,旨在评估大型多模态模型(LMMs)在链式思维(CoT)推理能力方面的表现。该框架覆盖了数学、科学、OCR、逻辑、时空和一般场景等六大领域,内含1,13...
MME-CoT

MeteoRA

南京大学计算机科学与技术系的研究团队推出了一种名为MeteoRA的多任务嵌入框架,旨在优化大型语言模型(LLM)的性能。该框架将多个任务特定的LoRA(低秩适配器)整合到一个基础模型中,促进了高效的参数复用及自主任务切换。MeteoRA基于混合专家(MoE)架构,利用可训练的门控网络动态选择最适合当...
MeteoRA

I2V-01-Director

海螺AI最新推出的AI视频生成模型I2V-01-Director是一款可以通过自然语言指令精准控制镜头的模型。用户可以像专业导演一样,指定镜头形式,例如推镜头、跟镜头和平移镜头,从而实现更高水平的创作。该模型有效降低了镜头的随机性,提升了视频生成的可控性,使生成视频更符合用户的创意想法。 I2V-0...
I2V-01-Director

Endex

Endex是一款专注于金融行业的智能平台,利用生成式AI技术为金融机构提供现代化的智能解决方案。其核心产品包括Nova自主金融分析师和ForgeAI原生编排层,旨在优化金融服务,帮助用户迅速提取关键信息并做出高效决策。借助先进的人工智能模型,如OpenAI的O系列模型,Endex能够处理复杂的金融文...
Endex

Claude 3.7 Sonnet

Anthropic公司推出的Claude 3.7 Sonnet是全球首款混合推理模型,具备“标准模式”和“扩展思考模式”两种操作方式。其中,标准模式适用于快速响应、日常对话和简单任务;而扩展思考模式则通过逐步推理来解决更复杂的问题,特别在数学、物理和编程领域展现出色,并在编码能力方面遥遥领先。 Cl...
Claude 3.7 Sonnet

Claude Code

Anthropic推出的智能编程工具——Claude Code,是一款具备多项功能的工具。目前处于研究预览版的阶段,通过自然语言命令帮助开发者更高效地进行编码,完美融入现有开发环境,无需额外配置。 Claude Code的主要功能包括: 代码搜索与阅读; 文件编辑与修改; 编写与运行测试; 提交与推...
Claude Code

DeepSeek:DeepEP

DeepEP 是DeepSeek发布的专家并行(EP)通信库,专门设计用于MoE模型的训练和推理。该库具有高吞吐量和低延迟的全对全GPU内核,支持节点内和节点间的NVLink和RDMA通信。特别优化了DeepSeek-V3论文中的组限制门控算法,并引入了基于Hook的通信-计算重叠技术,以确保不占用...
DeepSeek:DeepEP

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学共同推出的创新身份保持视频生成框架(IPT2V)。该系统基于增强的人脸知识,旨在生成高质量且身份一致的视频。FantasyID运用了扩散变换器技术,并结合3D面部几何先验知识,以确保在视频合成过程中面部结构的稳定性和合理性。此外,采用了多视角人脸增强策...
FantasyID

SigStyle

SigStyle是由吉林大学和Adobe合作开发的一种新型签名风格迁移框架。该框架利用个性化文本到图像扩散模型,将单一风格图像中的独特视觉元素转移到内容图像中。SigStyle支持全局和局部风格迁移、纹理迁移、风格融合等多种应用,同时通过时间感知注意力交换技术保持内容一致性。 SigStyle的主要...
SigStyle

BioMedGPT-R1

清华大学AI产业研究院(AIR)与北京水木分子生物科技有限公司合作开发的BioMedGPT-R1是一款先进的多模态生物医药开源大模型。利用DeepSeek R1技术,该模型新增了文本基座模型并实现了跨模态特征对齐,使得生物模态(如分子、蛋白质)与自然语言得以有效融合。BioMedGPT-R1能够处理...
BioMedGPT-R1

GRUtopia 2.0

上海人工智能实验室推出的GRUtopia 2.0是一款先进的通用具身智能仿真平台,是对GRUtopia 1.0的全面升级。它包含三大核心创新:通用模块化框架、场景资产自动化生成和高效数据采集系统。用户能够借助简单的“三行代码”定义复杂任务,无需在多个平台间切换。平台集成了百万级标准化物体资产,支持复...
GRUtopia 2.0

SigLIP 2:全新版本发布!

SigLIP 2是由谷歌DeepMind推出的先进的多语言视觉-语言模型,是SigLIP的升级版本,其强化了图像与文本之间的对齐能力。通过创新的训练方法和架构,SigLIP 2在多语言理解、零样本分类以及图像-文本检索等任务中表现出卓越性能。 SigLIP 2具有以下主要功能: 多语言支持:能够处理...
SigLIP 2:全新版本发布!

AvatarGO

AvatarGO是南洋理工大学S-Lab、上海AI Lab和香港大学联合开发的创新框架,旨在通过文本描述直接生成可动画化的4D人体与物体交互场景。AvatarGO采用零样本方法,并基于预训练的扩散模型,解决了传统技术在生成日常人机交互(HOI)场景时面临的挑战。其核心技术包括LLM引导的接触重定位和...
AvatarGO

Moonlight-16B-A3B

Moonlight-16B-A3B是Moonshot AI开发的一款创新型Mixture-of-Expert(MoE)模型,拥有160亿总参数和30亿激活参数。使用优化后的Muon优化器进行训练,计算效率为传统AdamW的两倍。在英语语言理解(MMLU)和代码生成(HumanEval)等任务中表现出...
Moonlight-16B-A3B

优雅YOYA

"优雅YOYA"是中科闻歌推出的一款音视频内容生成平台,旨在利用先进的人工智能技术提升视频内容创作的效率和质量。通过强大的大语言模型和多模态大模型支持,该平台具备文本生成视频、图像、数字人等多种功能,同时提供语音克隆、视频口型翻译、AI音乐创作等智能工具。用户只需简单输入主题要求,平台便能快速生成脚...
优雅YOYA

智川X-Agent

智川X-Agent目前支持多种语言,包括中文、英文等,用户可根据需求选择适合的语言进行应用构建。 智川X-Agent作为一站式企业智能体开发平台,致力于帮助各类企业快速构建符合业务需求的人工智能应用,推动AI技术在各行业的广泛应用和普及。通过其零代码构建、多种大模型集成、可视化工作流设计等功能,智川...
智川X-Agent

PixVerse V4 升级版发布:全新功能等你体验

PixVerse V4 是爱诗科技推出的最新 AI 视频生成工具,具有自动生成匹配音效的功能。该工具能够根据文本或图片输入快速创作高质量的 AI 视频,生成速度最快可达5秒。此版本在语义理解、物理表现和特效支持方面有了显著提升,能够生成时空扭曲、科幻场景等复杂内容。此外,PixVerse V4 还新...
PixVerse V4 升级版发布:全新功能等你体验

FlashMLA

FlashMLA是DeepSeek开源的高效MLA(多头线性注意力)解码内核,专为NVIDIA Hopper架构GPU进行优化。该产品通过优化KV缓存机制和采用BF16数据格式,提升了内存和计算效率。在H800 SXM5 GPU上,FlashMLA可实现高达3000GB/s的内存带宽和580TFLO...
FlashMLA

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室合作开发的一项创新框架,旨在将静态3D模型自动转换为可用于动画制作的资源。该系统基于自回归生成骨架的方法,能够预测蒙皮权重,使得模型可以展现出更真实的动画效果。MagicArticulate引入了Articulation-XL数据...
MagicArticulate

TANGLED

"TANGLED" 是一种由上海科技大学、Deemos Technology 和华中科技大学联合研发的创新型3D发型生成技术。这项技术能够从各种风格和角度的图像中生成高质量的3D发丝。通过多样性的 MultiHair 数据集,TANGLED 提供丰富的发型样本,并通过三个核心步骤来实现:首先,利用多...
TANGLED

Wysa:心理健康支持平台

Wysa是一种基于人工智能技术的心理健康支持平台,旨在为用户提供匿名和方便的情绪管理和心理疏导服务。通过利用机器人结合认知行为疗法等科学方法,Wysa帮助用户有效缓解焦虑、压力等情绪问题。该平台的服务对象包括个人用户、企业员工、保险公司客户以及医疗机构患者,旨在提供个性化护理和全天候在线支持。 Wy...
Wysa:心理健康支持平台

Argon

Argon是一款专注于制药、生物技术和生命科学领域的智能解决方案平台,致力于提升临床开发的自动化水平。该平台运用自然语言处理技术和专有数据库,能够快速分析临床试验数据,生成治疗领域的深刻洞察,并自动化繁重的数据处理任务,从而显著减少药物开发所需的时间和成本。 Argon的主要功能包括: AI驱动的洞...
Argon

Llasa TTS

Llasa TTS是香港科技大学开发的一款基于LLaMA架构的开源文本转语音(TTS)模型。这一模型采用高质量的语音合成和克隆技术,在训练和推理阶段表现出色,并支持情感表达、音色克隆等多种功能。Llasa TTS提供不同参数规模的模型,包括1B、3B和8B,能够生成多语言合成。 主要功能包括高质量语...
Llasa TTS

Miss Dora

Miss Dora是针对3至8岁儿童设计的AI英文阅读应用,旨在通过个性化的故事讲述和互动问答激发孩子的阅读热情与想象力。该应用拥有丰富的故事库,覆盖多个阅读水平,旨在支持孩子的学习,减轻家长的讲故事负担。Miss Dora融合了传统阅读和现代科技,为孩子们提供有趣而具有教育意义的学习体验。 Mis...
Miss Dora

问小白AiPPT

问小白AiPPT是一款由问小白推出的智能演示文稿生成工具,能够通过简单的操作快速创建PPT。用户只需输入相应的大纲或需求,系统即可迅速生成完整的PPT文件,并支持免费下载。该工具基于DeepSeek R1 671B满血版,具备稳定性和快速响应能力,目前完全免费,非常适合需要快速制作演示文稿的用户,在...
问小白AiPPT

文赋AI论文神器

文赋AI论文神器助您极速解锁论文写作新境界!还在为论文写作而苦恼吗?现在有一个解决方案!文赋AI论文神器即将问世了,只需轻轻一点,即可踏上论文创作的快车道,轻松告别写作困扰!这款神器提供了高效的智能论文生成功能,让您在短短5分钟内获得完整的论文初稿。不论是毕业论文、课程论文还是职称论文,应有尽有。从...
文赋AI论文神器

EVO 2:下一代的革新

Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型 Evo 2是由美国弧形研究所、英伟达和斯坦福大学等机构联合开发的前沿DNA语言模型,其目的在于为基因组建模和设计提供强大支持,并覆盖生命科学的各个领域。该模型基于StripedHyena 2架构,具备处理长达100万个碱基对的单核...
EVO 2:下一代的革新

OOMOL:基于VSCode构建的现代化集成开发环境(IDE)

OOMOL是一款基于VSCode构建的现代化集成开发环境(IDE),旨在简化工作流自动化的过程。借助其直观的拖拽式图形界面,用户可以轻松构建复杂的工作流,而无需具备编程背景。从预装的Python和Node.js环境,结合容器化技术,实现了开箱即用的体验,同时支持跨平台共享与数据安全隔离。它原生集成了...
OOMOL:基于VSCode构建的现代化集成开发环境(IDE)

Indic Parler-TTS

Indic Parler-TTS 是一个强大的多语言文本转语音(TTS)模型,由 Hugging Face 和 AI4Bharat 团队联合开发,专注于语言和英语的语音合成。作为 Parler-TTS Mini 的扩展版本,Indic Parler-TTS 支持 20 种语言及英语,提供 69 种独...
Indic Parler-TTS

Auto-Deep-Research

Auto-Deep-Research 是由香港大学黄超教授实验室开发的一款开源全自动个人AI助手,旨在为用户提供高效的深度研究支持。作为 OpenAI Deep Research 的开源替代品,该工具基于AutoAgent框架,采用模块化的多Agent结构,包含Web Agent、Coding Ag...
Auto-Deep-Research

ComfyUI-Copilot

阿里巴巴国际数字商业集团(AIDC-AI)推出了基于ComfyUI框架开发的AI智能助手——ComfyUI-Copilot。该智能助手采用自然语言交互的方式,为用户提供节点推荐、工作流构建协助和模型查询等功能,旨在降低ComfyUI的使用难度,提升开发效率。无论是初学者还是经验丰富的开发人员,Com...
ComfyUI-Copilot

SignLLM

SignLLM是一个多语言手语生成模型,能够将文字输入转化为对应的手语视频。作为全球首个支持多国手语的系统,它包括美国手语(ASL)、德国手语(GSL)、阿根廷手语(LSA)、韩国手语(KSL)等八种语言。该模型基于Prompt2Sign数据集开发,利用先进的自动化技术从网络中获取和处理手语视频,并...
SignLLM

Mercor:利用先进的人工智能技术优化求职和招聘流程

Mercor 是一个全球招聘的AI驱动平台,利用先进的人工智能技术优化求职和招聘流程。求职者上传简历并完成20分钟的AI面试后,Mercor将其信息与全球数千家公司的岗位需求匹配,助力用户找到远程工作机会。此外,Mercor为企业提供高效、合规的招聘解决方案,快速筛选和推荐优秀候选人,助企业全球构建...
Mercor:利用先进的人工智能技术优化求职和招聘流程

Webdraw:无代码开发平台

Webdraw是一个免费的AI应用生成平台,旨在帮助用户将手绘草图转换为Web应用,同时简化了AI应用的创建和使用过程,无需复杂的编程技能。该平台提供了图像生成、视频制作和助手等多种功能,支持用户通过自然语言描述或可视化工具快速构建应用。Webdraw的界面简洁操作简单,适合个人创作者、设计师和开发...
Webdraw:无代码开发平台

Ovis2

阿里国际推出了最新的多模态大语言系列模型 Ovis2,旨在通过结构化嵌入对齐技术有效解决视觉与文本之间的差异。Ovis2是在前一代 Ovis 模型基础上进行了优化,增强了小规模模型的性能密度,并通过指令微调和偏好学习显著提升了思维链(CoT)推理能力。 Ovis2采用结构化嵌入对齐方法,有效解决了视...
Ovis2

AgentSociety:清华大学开发的社会模拟工具

AgentSociety是一款由清华大学开发的社会模拟工具,基于大语言模型(LLM)构建。通过为智能体赋予情感、需求与认知能力,并模拟城市环境,实现复杂的社会行为和现象模拟。AgentSociety被广泛应用于社会现象分析、政策测试、危机预警及未来社会形态探索等领域。 AgentSociety的主要...
AgentSociety:清华大学开发的社会模拟工具
1 2 3 4 5