首页
专代考试

考试大纲

模拟考试

考试排行榜
考试中心

我的考试

错题集
题库

历年真题

我要出题

我要审题
IP资料库

文件

图片

音视频
知识分享
- 专利申请
  专利申请流程
  
  专利申请费用
  
  职务发明
  
  专利申请资助
  
  发明专利申请
  
  AI专利申请
  
  专利年费缴纳
  
  专利质量
  
  专利布局
- 专利考试
  专利法
  
  相关法
  
  实务
- 专利诉讼
  无效诉讼
  
  侵权诉讼
  
  国际诉讼
- 专利检索
  检索策略
  
  平台检索技巧
  
  查新检索
  
  防侵权检索
  
  技术主题检索
  
  无效检索
- 专利分析
  侵权风险分析
  
  价值分析
  
  知产评议
- 商标相关
  无效与诉讼
  
  申请与布局
  
  检索与分析
- 版权相关
  文字作品
  
  音频视频
  
  书画摄影
  
  软件著作
问答专区
求职招聘

找工作

找人才
专栏文章

资深文章

作者

我要投稿企业入驻个人入驻
排行榜

代理所排行榜

代理人排行榜

代理所区域排行榜

找代理所

找代理人

大学专利排行榜

企业竞争力分析
专利申请

登录 /
注册
专利汇授权登录

一种基于深度强化学习的路径规划奖励函数的设计方法公开发明

技术总结

本发明提供一种基于深度强化学习的路径规划奖励函数的设计方法，涉及路径规划技术领域。首先，计算智能体当前行驶速度与期望速度的欧氏距离，定义奖励公式，将奖励公式得到的计算结果作为奖励值赋予智能体；将障碍物分成动态障碍物和静态障碍物两类，计算两类碰撞障碍物时对智能体产生的速度障碍；计算智能体面对两种类型碰撞障碍物时最低逃脱速度障碍的成本值，并将成本值取负数作为奖励值来影响智能体的避碰行为；使用重要性因子对智能体面对动态障碍物时的最低逃脱速度障碍的成本值进行加权，得到加权后的成本；根据最安全的速度调整方向与智能体当前行驶速度的叉积、碰撞惩罚以及到达目标点奖励引导智能体学习避碰策略。

技术研发人员：

翟明圆; 宋志航; 肖冬; 姜楠; 王景杨; 闫泽林

受保护的技术研发主体：

东北大学

技术申请主体：

东北大学

技术研发申请日期：

2024-11-20

技术被公开/公告日期：

2025-03-07

相关技术

奖励函数相关技术

学习路径相关技术

翟明圆发明人的其他相关专利技术

专利代理人考试导航

网站导航

友情链接

本发明提供一种基于深度强化学习的路径规划奖励函数的设计方法，涉及路径规划技术领域。首先，计算智能体当...，盲点网为您提供一种基于深度强化学习的路径规划奖励函数的设计方法专利转让信息专利转让交易数据查询就上盲点网

© 2023 专利代理人模拟考试系统 - http://www.magndian.cc - 当前版本：v1.1 ，备案号：京ICP备20009519号