本发明公开了一种基于强化学习的网侧储能优化调度方法、装置、终端设备及计算机可读存储介质,方法包括:获取当前储能系统的状态空间;状态空间包括:剩余容量、负荷、可再生能源出力和电力价格;将当前储能系统的状态空间输入至预设的网侧储能优化调度模型中,以使模型根据当前储能系统的状态空间,输出对应的动作空间;动作空间包括:储能充电、储能放电、储能调度的容量和发电机出力;其中,在训练模型时,根据网侧储能系统价值构建奖励函数,继而根据奖励函数对模型损失函数进行更新,直至损失函数收敛;根据对应的动作空间,进行网侧储能的优化调度。通过实施本发明,更好地适应电网需求,提高电网的稳定性和可靠性。