Social dilemmas; Rational altruistic punishment; Reinforced learning; Algorithms; Self-interested agents;
机译:什么时候是利他主义惩罚在社会困境中有用?
机译:利他惩罚与群体间竞争:n人囚徒困境的证据
机译:策略中带有模糊控制器的策略梯度强化学习算法
机译:平民社会困境的悲剧中的情感,守信与利他惩罚
机译:社会强化,App靖与惩罚:笑声的多重功能
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:利他钢筋逃脱调理中加固梯度陡峭延迟