K8凯发(中国)AG国际-天生赢家·一触即发

英伟达推出AI护栏服务保障大语言模型安全性-K8凯发国际官方网站

您现在的位置: 首页 > 新闻动态 > 公司新闻

英伟达推出AI护栏服务保障大语言模型安全性

时期:2025-03-28 01:20:57 点击数:

  英伟达近期发布了一个全新的AI护栏服务,旨在加强大语言模型(LLM)的内容控制与安全性。该服务被命名为“NIM”,并已通过英伟达的NeMo护栏(NeMo Guardrails)套件向开发者开放。此举的主要目标是帮助开发者在构建AI系统时为其加入一系列规则,防止用户通过特定提示词绕过系统限制(即所谓的“越狱”行为),从而避免生成不符合预期或存在安全隐患的内容。

  NeMo护栏套件的核心技术基于英伟达的Aegis内容安全数据集,后者包含了大约3.5万个标注样本,并且已公开发布在Hugging Face平台上。这个数据集为AI模型提供了丰富的训练基础,帮助AI系统识别并阻止不当内容的生成。在大语言模型的开发过程中,尤其是在医疗、汽车和制造等行业,确保模型的安全性至关重要,英伟达的这一新服务正是针对这一需求而设计。

  此外,英伟达还推出了一款名为Garak的工具,专门用于漏洞扫描和安全性检测。该工具能够帮助开发者识别和修复模型中潜在的安全漏洞,尤其是防止模型输出不准确的幻觉内容或泄露企业机密。随着AI技术逐步深入各个行业,尤其是在涉及敏感数据的领域,保障AI生成内容的安全性和可靠性成为了企业关注的重点。

  ag凯发国际 ag平台

  ag凯发国际 ag平台

  英伟达强调,NeMo护栏套件不仅体积小巧,而且在性能上也有很高的效率,可以在绝大多数应用场景中流畅运行。企业在部署AI解决方案时,可以将这一安全套件直接嵌入到自家开发的AI系统中,以增强整体安全性。这项技术的应用不仅能为开发者提供更高的控制权,也有助于提升用户对AI系统的信任,避免不必要的风险和法律纠纷。

  Know Labs公布无创血糖检测仪最新进展 支持无创口检测人体的血糖指标

  保时捷女销冠回应连续2年卖出170台:数据线月XGP最佳游戏玩家投票:最受欢迎的是俄罗斯射击游戏《原子之心》

  《光环:无限》游戏第三赛季“Echoes Within”将于3月7日上线 今天发布了最新预告片

  《龙珠Z:电光火石》系列最新作先导预告片发布 将登陆PS5、Xbox Series以及PC平台

  LG将发布UltraGear OLED 950GX330A游戏显示器 支持45 Hz和950 Hz双模式

  自LG 展示UltraGear OLED 45GX950A 以来,已经过去了不到一个月,然后它又在本月早些时候在拉斯维加斯举行的 CES 2025 上展出了

Copyright © 2024 凯发护栏金属制品有限公司 版权所有