安全性

共 2 篇文章

Andrej Karpathy发布详细说明大型语言模型（视频提供中英文字幕）

本文介绍了计算机科学领域的杰出学者Andrej Karpathy博士发布的关于大型语言模型的视频概述。Karpathy博士在人工智能和深度学习领域具有较高的声誉，在OpenAI担任研究主管一职，为LLMs的发展做出了重要贡献。视频中，他详细介绍了LLMs的核心概念，包括推理、训练、梦境以及工作原理，...

AI工具箱3年前

ChatGPT安全性受到微调攻击风险：普林斯顿、斯坦福研究发布LLM预警

本文介绍了微调语言模型（LLM）可能存在的安全风险，指出微调过程中使用良性数据和角色扮演等方式可能破坏模型的性能对齐。虽然预训练语言模型在某些情况下表现出色，但在实际应用中，通常需要对其进行微调以适应特定任务。然而，微调后的模型安全性、对齐性能是否受影响，以及在面向用户时可能产生的风险等问题尚需进一...

AI工具箱3年前

安全性

Andrej Karpathy发布详细说明大型语言模型（视频提供中英文字幕）

ChatGPT安全性受到微调攻击风险：普林斯顿、斯坦福研究发布LLM预警

热门AI工具

CC Switch

热门AI应用