注册 | 登录 | 举报
  • 首 页
  • 公告沙龙
    • 公告中心
    • 活动沙龙
  • 课程学习
  • 项目交流
    • 项目招募
    • 问答中心
  • 信息展示
    • 项目展示
    • 往年项目展示
    • 校内导师
    • 校外导师
  • 使用指南
    • 文件下载
    • 常见问题

举报该页有违规/非法信息


  • 最新

蓝盾——一站式大语言模型安全监测与增强平台

 人工智能学院

BlueDon

近期,大语言模型(Large Language Model,简称LLM)研究取得了一系列突破性进展,多家技术企业相继推出商业大模型,如OpenAI的ChatGPT、GPT4, GooglePaLM2,Meta的LLaMA、阿里的通义千问、百度的文心一言等。随着参数量突破千亿级别,大语言模型在处理众多文本任务表现出极强的能力,包括代码生成、文档分析、智能对话等。但是,在大模型在商业化落地的同时,大模型本身技术也面临更多方面的威胁。攻击者通过运用一些指令绕过的攻击方式使得大模型输出特定的违规内容,破坏大模型本身的安全系统,将会给社会造成重大的损失。如何监测大模型本身存在的安全漏洞,同时构建安全防御体系正变得越来越重要。 本项目——蓝盾(BlueDon)开发了一套大语言模型的安全漏洞查找和安全防御系统,通过系统的攻击全面找到大语言模型的安全漏洞,再根据安全漏洞报告构建个性化的防御体系。

项目分数

项目信息

  • 项目动态
  • 项目相关人员
  • 项目荣誉
  • 留言

项目负责人

王殿云2022级 人工智能学院 大类招生

项目成员

马庆森2022级 人工智能学院 人工智能

潘泽楷2022级 人工智能学院 人工智能(大类)

陈姝羽2022级 计算机学院(国家示范性软件学院) 数据科学与大数据技术

王艺栋2022级 人工智能学院 人工智能专业

指导老师

吴惠甲人工智能学院 讲师

评审老师

宋原人工智能学院 工程师

望育梅人工智能学院 副教授

暂无留言
该项目暂无荣誉
邮箱:buptwin@bupt.edu.cn;传真:010-62285134;电话:010-62281946;地址:北京邮电大学教一楼323; 邮编:100876
北京邮电大学叶培大创新创业学院 © Copyright 2017
Baidu
map