首页> 中国专利> 一种基于生成式目标课程学习的自博弈智能对抗方法

一种基于生成式目标课程学习的自博弈智能对抗方法

摘要

本发明涉及智能体自博弈训练技术领域,尤其涉及一种基于生成式目标课程学习的自博弈智能对抗方法,包括筛选目标课程以组成训练集和验证集,使用训练集训练一个目标生成式对抗网络模型并根据模型的loss值对模型的学习率进行调节,学习率调节完成后,根据训练结果的误差率和标准误差确定最佳训练次数,在对模型进行验证时根据验证合格率对模型的迭代次数进行调节,在判定模型训练完成后,可产生新目标以进行自我博弈智能体训练。本发明采用生成式目标课程以设计学习目标的方法,采用渐进式的学习,逐渐地提高智能体自身和对手的水平,通过不断与自身或自身历史版本的对抗提升能力,进而提高智能体习得策略的速度和鲁棒性。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-04

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号