注册 | 登录 | 举报
  • 首 页
  • 公告沙龙
    • 公告中心
    • 活动沙龙
  • 课程学习
  • 项目交流
    • 项目招募
    • 问答中心
  • 信息展示
    • 项目展示
    • 往年项目展示
    • 校内导师
    • 校外导师
  • 使用指南
    • 文件下载
    • 常见问题

举报该页有违规/非法信息


  • 最新

面向大模型的自动生成提示攻击研究

 网络空间安全学院

Research on automatic generation of attacks for large models

大模型,如ChatGPT,已在科研、编程等领域显示出极大潜力,被广泛采用于生成文本与图像。然而,它们的普及也带来了挑战,比如存在生成有毒或误导性内容的风险,攻击者通过设计精巧的提示绕过保护措施,可能导致违规内容。当前,大多数攻击研究依赖手动制作的提示,这种方法虽能精准修改,但存在应用范围窄、人力要求高的问题。因此,本项目研究自动化攻击系统以提高攻击的效率和准确率,并探索对应的防御方式。研究支撑资源有:大模型api、高性能服务器等。

项目分数

项目信息

  • 项目动态
  • 项目相关人员
  • 项目荣誉
  • 留言

项目负责人

何俊涛2021级 网络空间安全学院 网络空间安全

项目成员

冯皓2021级 网络空间安全学院 网络空间安全

陈万桥2021级 网络空间安全学院 网络空间安全

指导老师

袁雪敬网络空间安全学院 讲师

评审老师

郭凯国际学院 高级工程师

武斌网络空间安全学院 讲师

付俊松网络空间安全学院 讲师

暂无留言
该项目暂无荣誉
邮箱:buptwin@bupt.edu.cn;传真:010-62285134;电话:010-62281946;地址:北京邮电大学教一楼323; 邮编:100876
北京邮电大学叶培大创新创业学院 © Copyright 2017
Baidu
map