本发明涉及机器人路径规划技术领域,尤其是指一种融合动态窗口和PPO算法的机器人路径规划方法、装置及计算机可读存储介质,包括:基于动态窗口法构建机器人运动模型,并限制机器人运动模型的速度窗口,建立机器人运动模型的评价函数;在训练环境中,将机器人运动模型的评价函数中的权重参数作为可学习参数,给定可学习参数的范围,利用近端策略优化算法对可学习参数进行学习,输出目标权重参数,得到机器人运动模型的目标评价函数。本发明使得机器人进行路径规划时具有平滑的自主学习能力,提高了机器人在具有动态障碍的环境的适应能力,也提高了机器人在复杂多变的环境下规划的路径的质量。