一种基于强化学习的网侧储能优化调度方法、装置、终端设备及计算机可读存储介质

一种基于强化学习的网侧储能优化调度方法、装置、终端设备及计算机可读存储介质公开发明

技术总结

本发明公开了一种基于强化学习的网侧储能优化调度方法、装置、终端设备及计算机可读存储介质，方法包括：获取当前储能系统的状态空间；状态空间包括：剩余容量、负荷、可再生能源出力和电力价格；将当前储能系统的状态空间输入至预设的网侧储能优化调度模型中，以使模型根据当前储能系统的状态空间，输出对应的动作空间；动作空间包括：储能充电、储能放电、储能调度的容量和发电机出力；其中，在训练模型时，根据网侧储能系统价值构建奖励函数，继而根据奖励函数对模型损失函数进行更新，直至损失函数收敛；根据对应的动作空间，进行网侧储能的优化调度。通过实施本发明，更好地适应电网需求，提高电网的稳定性和可靠性。

技术研发人员：

周姝灿; 左婧; 吴伟杰; 孙宇军; 左郑敏; 张伊宁; 卢洵; 蔡煜; 苏向阳; 李逸欣; 郑昕; 龚贤夫; 董家读; 李作红; 呼士召; 陈艺丹; 金楚

受保护的技术研发主体：

广东电网有限责任公司

技术申请主体：

广东电网有限责任公司

技术研发申请日期：

2024-11-13

技术被公开/公告日期：

2025-03-07