首页 / 用于训练基于深度学习的机器学习算法的方法

用于训练基于深度学习的机器学习算法的方法公开 发明

技术领域

[0001] 本发明涉及一种用于训练基于深度学习的机器学习算法以及尤其是一种可用来以简单的方式并且以比较少的资源消耗来训练关于特定应用经优化的基于深度学习的机器学习算法的方法。

相关背景技术

[0002] 机器学习算法基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。
[0003] 此类机器学习算法例如在驾驶员辅助系统中应用或者在控制自主驾驶机动车辆时应用。在此,例如在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。
[0004] 在此,对在自主驾驶机动车辆周围的其它车辆的未来驾驶机动的此类预测通常基于隐马尔可夫模型。隐马尔可夫模型是一种随机模型,在该随机模型中,通过具有未观察状态的马尔可夫链来对系统进行建模。然而,在这种情况下,被证明为不利的是:与对由隐马尔可夫模型做出的预测进行进一步处理的组件或应用相关的性能指标或要求实际上通常只以非连续或不可微函数的形式存在。此外,隐马尔可夫模型是相对简单的模型,这些模型通常不会涵盖所有与实践相关的情况或依赖关系。
[0005] 从出版文献WO 2007/011529A2中已知一种用于训练机器学习算法的方法,其中机器学习算法具有一组估计的梯度,这些梯度至少部分地基于通过机器学习算法所生成的有序或分类的输出。在此,可以选择这些估计的梯度,而不是反映成本函数的要求的不可微成本函数,而且这些估计的梯度可以被用于在训练机器学习算法期间确定或修改机器学习算法的参数。

具体实施方式

[0050] 图1示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的方法1的流程图。
[0051] 机器学习算法基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。
[0052] 此类机器学习算法例如在驾驶员辅助系统领域中应用或者在控制自主驾驶机动车辆时应用。在此,例如在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。
[0053] 在此,对在自主驾驶机动车辆周围的其它车辆的未来驾驶机动的此类预测通常基于隐马尔可夫模型。隐马尔可夫模型是一种随机模型,在该随机模型中,通过具有未观察状态的马尔可夫链来对系统进行建模。然而,在这种情况下,被证明为不利的是:与对由隐马尔可夫模型做出的预测进行进一步处理的组件或应用相关的性能指标或要求实际上通常只以非连续或不可微函数的形式存在。此外,隐马尔可夫模型是相对简单的模型,这些模型通常不会涵盖所有与实践相关的情况或依赖关系。
[0054] 在此,图1示出了用于训练与特定应用情况适配的基于深度学习的机器学习算法的方法1,其中该方法1具有:步骤2:提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;步骤3:基于训练数据通过机器学习方法来训练基于深度学习的机器学习算法;和步骤4:然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。
[0055] 在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。
[0056] 还基于与相对应的应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数还具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。
[0057] 因此,总的来说,说明了一种经改进的用于预测未来状态的方法1,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。
[0058] 因此,图1在此尤其示出了用于训练基于深度学习的机器学习算法的混合方法1。
[0059] 在此,按照图1的实施方式,基于深度学习的机器学习算法尤其是基于深度学习的分类器。
[0060] 按照图1的实施方式,通过机器学习方法来训练基于深度学习的机器学习算法的步骤2还具有:基于可微成本函数、例如基于梯度下降法,训练基于深度学习的机器学习算法。
[0061] 按照图1的实施方式,基于不可微成本函数来优化经过训练的基于深度学习的机器学习算法的至少一个参数的步骤3还具有:基于温度缩放,优化经过训练的基于深度学习的机器学习算法。
[0062] 在此,基于温度缩放的优化尤其可以基于贝叶斯优化方法来进行。在此,如果相对应的参数空间小,则贝叶斯优化方法工作效果最佳,其中这里只考虑一个参数、即温度。另一方面,对于大量参数或者例如在具有多个层的神经网络的情况下出现的大参数空间,贝叶斯优化通常只能困难实现。但是,此外例如也可以使用网格搜索方法来优化基于深度学习的机器学习算法。
[0063] 在此,这些训练数据还具有传感器数据,其中相对应的传感器尤其可以是光学传感器,例如雷达传感器、摄像机或激光雷达传感器。
[0064] 在此,基于深度学习的机器学习算法然后尤其可以被用于控制可控系统、例如自主驾驶机动车辆的自动距离调节装置。
[0065] 在此,基于深度学习的机器学习算法例如可以是用于预测在自主驾驶机动车辆周围的机动车辆的未来驾驶机动的系统的部分,该系统被训练为:例如基于关于机动车辆的当前速度、机动车辆的当前位置、机动车辆与自主驾驶机动车辆之间的相对距离以及必要时还有机动车辆的信号灯的当前状态的所检测到的值,预测该机动车辆的未来驾驶机动,例如它是否可能很快就会变换车道。在此,基于深度学习的机器学习算法例如可以是基于历史数据或者在先前的行驶期间收集的数据或者关于机动车辆的速度和/或该机动车辆的位置和/或该机动车辆距自主驾驶机动车辆的相对距离与该机动车辆的随后的驾驶机动之间的关系的信息来训练的。
[0066] 然后,通过基于深度学习的机器学习算法所做出的预测例如可以被用于规定应该基于自主驾驶机动车辆周围的哪个车辆来调节自主驾驶机动车辆的自动距离调节装置或自适应巡航控制器。
[0067] 图2示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的控制设备10的示意性框图。
[0068] 在此,如图2所示,该控制设备10具有:提供单元11,该提供单元被设计为提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;训练单元12,该训练单元被设计为基于这些训练数据通过机器学习方法来训练基于深度学习的机器学习算法;和优化单元13,该优化单元被设计为:然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。
[0069] 在此,该提供单元尤其可以是接收器,该接收器被设计为接收相对应的数据、尤其是传感器数据。在此,该训练单元和该优化单元例如可以分别基于寄存在存储器中并且可通过处理器来执行的代码来实现。
[0070] 在此,按照图2的实施方式,该训练单元12被设计为:基于可微成本函数来训练基于深度学习的机器学习算法。
[0071] 按照图2的实施方式,该优化单元13还被设计为:基于温度缩放来优化经过训练的基于深度学习的机器学习算法。

当前第1页 第1页 第2页 第3页
相关技术
学习算法相关技术
机器学习相关技术
A·希雷玛斯发明人的其他相关专利技术