首页 / 学习方法

学习方法实质审查 发明

技术领域

[0001] 本公开内容涉及一种学习方法。

相关背景技术

[0002] 国际公开第2020/070786号中公开有一种色谱系统。该色谱系统通过使用了推定模型的AI(Art i f i c i a l I nte l l i gence:人工智能)分离并检测色谱图的未分离峰的峰。然后,色谱系统基于该峰执行试样的定性分析或者定量分析。
[0003] 在国际公开第2020/070786号中,公开有计算机执行用于更新推定模型的学习这一内容。该计算机获取各自具有峰的多个色谱图,通过将该多个色谱图相加而生成未分离峰的色谱图。计算机将该多个色谱图作为学习数据,将该生成的色谱图作为训练数据,更新推定模型。

具体实施方式

[0022] 以下,参照附图对本发明的实施方式详细地进行说明。另外,对图中相同或相当的部分标注相同附图标记,不再重复对其说明。
[0023] <第1实施方式>
[0024] [分析系统]
[0025] 本公开内容涉及对用于检测由分析装置生成的信号波形的峰的推定模型进行更新的学习的技术。分析装置例如为气相色谱仪(GC:Gas Chromatograph)装置、液相色谱仪(LC:L i qu i d Chromatography)装置、质量分析装置、分光光度计及X射线分析装置等。
[0026] 例如,信号波形可以是色谱图波形或者质谱波形。在分析装置为分光光度计的情况下,信号波形成为吸光光谱波形。在分析装置为X射线分析装置的情况下,信号波形成为X射线光谱波形。
[0027] 此外,推定模型(后述的推定模型121)的学习(学习处理)包括新生成(构建)尚未构建的推定模型的处理与更新已构建的推定模型的处理。“更新推定模型”包括更新推定模型的参数的处理。此外,也将通过学习处理而更新(最优化)的推定模型称为“学习完毕模型”。此外,也将学习前的推定模型及学习完毕的推定模型统称为“推定模型”。以下,以“推定模型的学习为推定模型的更新的例子”为主进行说明。
[0028] 在本实施方式中,对采用液相色谱仪的分析系统进行说明。图1是示出分析系统100的构成例的图。分析系统100具备分析装置35、输入装置61、显示装置65与学习装置30。
分析装置35具备测量部10与数据解析装置25。数据解析装置25及学习装置30例如由信息处理装置(例如PC(Persona l Computer:个人计算机))构成。在图1的例子中,数据解析装置
25及学习装置30单独示出,但也可以一体化。学习装置30对应于本公开内容的“计算机”。
[0029] 输入装置61例如是键盘或鼠标等定点设备,接受来自用户的指令。显示装置65例如由液晶(LCD:L i qu i d Crysta l D i sp l ay(液晶显示器))面板构成。显示装置65显示各种图像。在使用触摸面板作为用户接口的情况下,输入装置61与显示装置65一体地形成。输入装置61与数据解析装置25及学习装置30连接。此外,显示装置65与数据解析装置25连接。
[0030] 数据解析装置25具有控制部20。控制部20控制测量部10。测量部10包括流动相容器11、泵12、注射器13、色谱柱14、检测器15与配置部18。在配置部18中配置有分析对象的试样S。该试样S通过溶于规定的溶剂而成为试样液。在流动相容器11中容纳有流动相。泵12抽吸容纳在流动相容器11中的流动相而以大致恒定的流速(或者流量)输送至色谱柱14。
[0031] 注射器13按照与来自控制部20的指示对应的规定的时机,将试样液以规定量注入至流动相中。注入的试样液随着流动相的流动而被导入至色谱柱14。试样液中包含的各种成分在通过色谱柱14的期间在时间方向上分离而洗脱。即,色谱柱14根据保留时间分离试样液所包含的成分。
[0032] 检测器15检测从色谱柱14洗脱的洗脱液中的成分。检测器15将与该成分的量对应的强度的检测信号输出至数据解析装置25。检测器15例如使用采用了光电二极管阵列(PDA:Photod i ode Array)检测器等的光学检测器等。
[0033] 数据解析装置25除了具有上述的控制部20之外,还具有数据收集部110、峰检测处理部111与解析部117。
[0034] 数据收集部110以规定时间间隔对从检测器15输出的检测信号进行采样并转换成数字数据。数据收集部110将该数字数据存储在规定的存储区域(未图示)。该数字数据是示出色谱图波形的数据(以下也称为“色谱图数据”)。
[0035] 峰检测处理部111利用AI(人工智能:Art i f i c i a l I nte l l i gence)推定(导出)基于由数据收集部110收集到的色谱图数据的色谱图的峰。
[0036] 在本实施方式中,峰检测处理部111具有模型存储部114与峰决定部116。此外,模型存储部114中例如存储有通过机器学习生成的推定模型121(神经网络)。该推定模型121例如由规定的函数表现。规定的函数例如是EMG(Exponet i a l l y Mod i f i ed Gauss i an:指数修正高斯)函数。
[0037] 此外,峰决定部116将基于由数据收集部110收集到的色谱图数据而得的色谱图输入至推定模型121。推定模型121输出色谱图的峰。如上所述,峰检测处理部111推定基于由数据收集部110收集到的色谱图数据而得的色谱图的峰,输出至解析部117。
[0038] 观测到峰的时间(保留时间)与成分的种类对应。该色谱图被发送至数据解析装置。数据解析装置根据该色谱图中包含的峰的保留时间来确定成分。也将该确定称为“定性分析”。
[0039] 此外,色谱图的峰的高度及峰的面积与试样的成分的浓度或者含量对应。数据解析装置根据该色谱图中包含的峰的高度或者面积值来确定试样的成分的浓度和含量。也将该确定称为“定量分析”。
[0040] 解析部117在从峰决定部116输出的峰中求出该峰的峰顶的位置(时间)与该峰的面积值(或者高度)。解析部117根据色谱图上的各峰的位置的信息来确定成分。此外,解析部117利用预先生成的标准曲线,根据峰面积值(或者高度值)计算各成分的含量。如此,解析部117执行试样中包含的各成分的定性分析及定量分析。解析部117将定性分析结果及定量分析结果显示在显示装置65。
[0041] 此外,如后所述,学习装置30更新推定模型121(执行推定模型121的学习)。由用户对输入装置61执行规定操作,由此将分析系统100的模式切换至学习模式。学习装置30在该学习模式中更新推定模型121。
[0042] [学习装置的硬件构成]
[0043] 图2是示出本实施方式的学习装置30的硬件构成的方框图。如图2所示,学习装置30具备控制装置21、存储装置19、介质读取装置17、通信接口23作为主要的硬件元件。
[0044] 如后所述,控制装置21执行推定模型121的更新。控制装置21例如由CPU(Centra l Process i ng Un it:中央处理器)、FPGA(F i e l dProgrammab l e Gate Array:现场可编程门阵列)及GPU(Graph i cs Process i ng Un it:图形处理器)等构成。另外,控制装置21可以由CPU、FPGA及GPU中的至少1个构成,也可以由CPU与FPGA、FPGA与GPU、CPU与GPU或者由CPU、FPGA及GPU的全部构成。此外,控制装置21也可以由运算电路(process i ng c i rcu i try)构成。
[0045] 存储装置19包含在控制装置21执行任意程序时临时保存程序代码或工作内存等的易失性的存储区域(例如工作区)。例如,存储装置19由DRAM(动态随机存储器:Dynami c Random Access Memory)或者SRAM(静态随机存储器:Stat i c Random Access Memory)等易失性存储器件构成。
[0046] 进而,存储装置19包含非易失性的存储区域。例如,存储装置19由硬盘或者SSD(固态硬盘:So l i d State Dr i ve)等非易失性存储器件构成。
[0047] 另外,在本实施方式中,示出了在同一存储装置19中包含易失性的存储区域与非易失性的存储区域的例子,但易失性的存储区域与非易失性的存储区域也可以包含在相互不同的存储装置中。例如,也可以是控制装置21包含易失性的存储区域,存储装置19包含非易失性的存储区域。学习装置30也可以具备包含控制装置21与存储装置19的微型计算机。
[0048] 存储装置19保存推定模型121与控制程序122。推定模型121包含神经网络与在该神经网络中的处理中使用的参数。
[0049] 推定模型121包含至少能够进行机器学习的程序,基于学习用数据(训练数据)进行机器学习,从而将参数最优化(调整、更新)。学习装置30将最优化的推定模型(图7的推定模型121A)发送至数据解析装置25。数据解析装置25将存储在模型存储部114中的推定模型121更新为该发送的推定模型121A(最优化的推定模型)。如此,峰检测处理部111使用更新后的推定模型121而推定峰,由此能够使峰的推定精度提高。
[0050] 也将更新推定模型121的参数的处理称为“学习处理”。此外,也将通过学习处理而最优化的推定模型121称为“学习完毕模型”。此外,在本实施方式中,也将学习前的推定模型121及学习完毕的推定模型121统称为“推定模型”。特别地,也将学习完毕的推定模型121称为“学习完毕模型”。此外,控制程序122是由控制装置21执行的程序。
[0051] 介质读取装置17接收可移动磁盘等记录介质130,获取保存在记录介质130中的数据。该数据例如是控制程序。此外,控制程序122也可以保存在记录介质130(例如可移动磁盘)中而作为程序产品流通。此外,控制程序122可以作为所谓的能够通过互联网等下载的程序产品而由信息供应商提供。控制装置21读取由记录介质130或者互联网等提供的程序。控制装置21将读取的程序存储在规定的存储区域(存储装置19的存储区域)。控制装置21通过执行该存储的控制程序122而执行后述的学习处理。
[0052] 记录介质130不限于DVD‑ROM(D i g ita l Versat i l e D i sk Read On l yMemory:数字多功能磁盘只读存储器)、CD‑ROM(compact d i sc read‑on l ymemory:只读光盘存储器)、FD(F l ex i b l e D i sk:软磁盘)、硬盘,还可以设为磁带、盒式磁带、光盘(MO(Magnet i c Opt i ca l D i sc:磁光盘)/MD(M i n i D i sc:迷你光盘)/DVD(D i g i ta l Versat i l e D i sc:数字多功能光盘))、光卡、掩模ROM、EPROM(E l ectron i ca l l yProgrammab l e Read‑On l y Memory:电可编程只读存储器)、EEPROM(E l ectron i ca l l y Erasab l e Programmab l e Read‑On l y Memory:电可擦可编程只读存储器)、闪存ROM等半导体存储器等以固定方式承载程序的介质。此外,记录介质130是可供计算机读取控制程序122等的非暂态介质。
[0053] 通信接口23是用于连接数据解析装置25的接口,实现学习装置30与数据解析装置25之间的数据的输入输出。在本实施方式中,学习装置30经由通信接口23获取从数据解析装置25发送的实测色谱图数据及空白色谱图数据。以下,将实测色谱图数据及空白色谱图数据统称为色谱图数据。此外,学习装置30经由通信接口23将更新后的推定模型121发送至数据解析装置25。
[0054] [疑似色谱图]
[0055] 接着,对疑似色谱图进行说明。疑似色谱图是学习装置30用于更新推定模型121的信息。图3是用于对疑似色谱图进行说明的图。在图3的(A)~图3的(C)所示的色谱图中,纵轴表示信号强度,横轴表示时间(保留时间)。
[0056] 图3的(A)是示出疑似噪声的一例的图。疑似噪声是模拟了设想噪声的噪声。设想噪声是在分析装置35分析试样S的情况下能产生(设想产生)的噪声。作为产生设想噪声的原因,有在色谱柱14内混入杂质成分或者基线的漂移等原因。存在1种以上设想噪声。在本实施方式中,疑似噪声通过由分析装置35执行空白测量而生成。
[0057] 在此,空白测量是通过在配置部18未配置试样S的状态下由分析装置35执行分析处理而进行的处理。空白测量例如包括以下的第1空白测量、第2空白测量、第3空白测量及第4空白测量。
[0058] 第1空白测量为,例如在分析装置35由气相色谱仪构成的情况下,在配置部18中未配置试样S的状态下仅分析载气的处理。
[0059] 第2空白测量为,生成未添加试剂(例如衍生化试剂)及试样而仅由溶剂构成的第1疑似试样,分析该第1疑似试样的处理。第3空白测量为,生成未添加试样而仅由试剂及溶剂构成的第2疑似试样,分析该疑似试样的处理。
[0060] 此外,在第4空白测量中,使用在分析试样时执行的前处理。第4空白测量为,对载气、第1疑似试样及第2疑似试样中的任一个执行与上述前处理相同的前处理,分析执行该前处理后的物质的处理。
[0061] 此外,在第1~第4空白测量中,按照第4空白测量、第3空白测量、第2空白测量及第1空白测量的排序,产生污染的频率变高,噪声强度变大。即,能在第4空白测量中产生的噪声强度最高,能在第1空白测量中产生的噪声强度最低。
[0062] 在本实施方式中,通过由测量部10执行N次(N为2以上的整数)空白测量而生成空白色谱图。该空白色谱图对应于疑似噪声。此外,该疑似噪声对应于本公开内容的“噪声波形”。如此,空白测量是用于生成疑似噪声的测量,因此也称为“噪声测量”。
[0063] 图3的(B)是示出疑似峰的一例的图。疑似峰是模拟色谱图的峰的波形。疑似峰中不包含噪声,而包含峰与基线。如后所述,疑似峰是通过由分析装置35分析试样S而生成的信息。
[0064] 图3的(C)是示出疑似色谱图的一例的图。学习装置30通过将疑似噪声与疑似峰相加从而生成疑似色谱图。然后,学习装置30基于所生成的疑似色谱图而更新推定模型121。具体而言,学习装置30将疑似色谱图作为学习数据,将疑似峰作为训练数据,更新推定模型
121。
[0065] 此外,测量部10通过新分析未知试样而生成色谱图。在该分析中,有时会在检测器15的检测信号中包含上述设想噪声。在该情况下,生成在基线中包含噪声的色谱图。
[0066] 数据解析装置25通过对上述更新后的推定模型121输入包含该设想噪声的色谱图数据,从而检测峰。在此,如上所述,推定模型121进行学习,该学习将疑似色谱图作为学习数据,将疑似峰作为训练数据。因此,数据解析装置25通过使用该推定模型121,能够适当地检测排除了设想噪声的色谱图即峰。如此,在新分析未知试样的情况下,即使在生成了包含设想噪声的色谱图的情况下,也能够通过使用推定模型121而提高峰检测的精度。此外,学习装置30能够对与分析未知试样的情况下进行生成的状况相同的状况(生成信号波形这一状况)下的推定模型进行学习。
[0067] 此外,学习装置30也可以在不包含疑似峰的情况下将疑似噪声作为学习数据而更新推定模型121。即,学习数据(学习数据集)中包括包含疑似峰的第1疑似色谱图与不包含疑似峰的第2疑似色谱图中的至少一方。第1疑似色谱图例如是将疑似峰与疑似噪声相加的疑似色谱图。此外,第2疑似色谱图例如是不包含疑似峰而由疑似噪声构成的疑似色谱图。
[0068] [关于非设想噪声]
[0069] 接下来,对非设想噪声进行说明。如上所述,通过执行空白测量而生成疑似噪声。然而,存在在疑似噪声中包含非设想噪声的情况。非设想噪声是在由测量部10进行分析的情况下不能包含的噪声。因此,如果使用包含非设想噪声的疑似噪声而由学习装置30更新推定模型121,则使用该推定模型121的峰检测的精度降低(推定模型的品质降低)。非设想噪声也被称为“不期望的噪声”。
[0070] 在此,对可能包含非设想噪声的理由进行说明。例如,存在在空白测量时,在测量部10的任一个构成部或者溶剂中混入未设想的异物的情况。该构成部例如是泵12。在以混入这样的异物的状态执行空白测量的情况下,由该异物引起的峰(非设想噪声)包含在疑似噪声中。
[0071] 此外,例如,在测量部10由气相色谱仪构成的情况下,对未知试样进行分析时,利用衍生化试剂使该未知试样衍生化。在测量部10由气相色谱仪构成的情况下,将试样S配置在配置部18中,另一方面,使用衍生化试剂执行空白测量。因此,通过该空白测量,源自衍生化试剂的峰(非设想噪声)包含在疑似噪声中。
[0072] 因此,在本实施方式中,学习装置30基于N个空白色谱图的各相关系数,判定非设想噪声是否包含在疑似噪声中。在判断为包含非设想噪声的情况下,排除包含该非设想噪声的疑似噪声,更新推定模型121。由此,能够提高使用了推定模型121的峰检测的精度。
[0073] 图4及图5是通过执行60次(=N次)空白测量而生成的空白色谱图的一例。图4是不包含非设想噪声的空白色谱图(疑似噪声)的一例。图5是包含非设想噪声M的空白色谱图(疑似噪声)的一例。
[0074] 如图4的上层所示,在不包含非设想噪声的情况下,通过N次的空白测量,能产生每次有不同的设想噪声包含在空白色谱图中的现象。鉴于该现象,N个空白色谱图中的1色谱图Bn(n=1,...,N)和与该色谱图Bn不同的其他色谱图Bm(m=1,...,N)的相关系数变低。另外,m与n不同(m≠n)。
[0075] 于是,学习装置30计算1色谱图Bn与其他色谱图Bm的L个相关系数。另外,L=NC2个。然后,学习装置30计算该L个相关系数的平均值或者合计值。在本实施方式中,学习装置30计算L个相关系数的平均值。并且,在该平均值小于预先决定的阈值的情况下,判断为在空白色谱图中不包含非设想噪声。
[0076] 图4的下层是示出L个相关系数的热图的一例的图。该热图的纵轴表示1色谱图Bn,横轴表示其他色谱图Bm。如图4的下层所示,在非设想噪声不包含于疑似噪声的情况下,相关系数整体变低。另外,在图4的下层的例子中,L个相关系数的平均值为0.03。另外,相关系数对应于本公开内容的“类似程度”。类似程度是示出N个色谱图中的1色谱图Bn与其他色谱图Bm的类似程度的值。在本实施方式中,1色谱图Bn与其他色谱图Bm越类似,类似程度(相关系数)越大。作为变形例,也可以采用1色谱图Bn与其他的色谱图Bm越类似,变得越小的类似程度。另外,类似程度也可以是其他参数,例如也可以是1色谱图Bn与其他色谱图Bm的距离(例如弗雷歇距离)。
[0077] 另一方面,如图5的上层所示,在包含非设想噪声的情况下,在N次空白测量中的任一次中,在同一保留时间段中均能产生峰。在图5的上层中,产生作为非设想噪声M的峰。因此,L个相关系数的平均值变大。因此,学习装置30在该L个相关系数的平均值为上述阈值以上的情况下,判断为在空白色谱图中包含非设想噪声。
[0078] 图5的下层是示出L个相关系数的热图的一例的图。如图5的下层所示,在疑似噪声中包含非设想噪声的情况下,相关系数整体变高。另外,在图5的下层的例子中,L个相关系数的平均值为0.97。
[0079] [学习装置的功能模块]
[0080] 图6是学习装置30的功能模块图。学习装置30具有输入部32、提取部34、GAN执行部36、噪声生成部38、更新部40。学习装置30是在学习模式下更新推定模型121的装置。用户通过对输入装置61进行规定的操作,将分析系统100的模式转移至学习模式。
[0081] 对输入部32输入实测色谱图数据及空白色谱图数据。实测色谱图数据是通过由测量部10测量设置在配置部18的试样而得到的数据。试样可以是成分未知的未知试样,也可以是成分已知的已知试样。空白色谱图数据是在配置部18未设置试样的状态下由测量部10测量而得到的数据。另外,作为变形例,实测色谱图数据及空白色谱图数据中的至少一方也可以由等同于测量部10的装置生成。
[0082] 实测色谱图数据被输入到提取部34,空白色谱图数据被输入到噪声生成部38。另外,对色谱图数据赋予标志。该标志是用于判别是实测色谱图数据及空白色谱图数据中的哪一个的信息。对实测色谱图数据赋予示出是该实测色谱图数据的实测标志。对空白色谱图数据赋予示出是该空白色谱图数据的空白标志。输入部32通过判别附加于色谱图数据的标志,判别该色谱图数据是实测色谱图数据及空白色谱图数据中的哪一个。输入部32将实测色谱图数据发送至提取部34,并且将空白色谱图数据发送至噪声生成部38。
[0083] 提取部34提取实测色谱图的波形形状良好的峰。作为具体方法的一例,提取部34例如从实测色谱图数据中去除规定峰。规定峰例如包含SN比极低的峰及分离不充分的峰等。然后,提取部34计算与所提取的峰相关的形状参数(以下也称为“峰参数”)。例如,峰参数包含拖尾程度、前延程度、峰宽度及SN比(s i gna l no i se rat i o)等中的至少一项。
[0084] 进而,提取部34不仅计算峰参数,还计算色谱图参数。色谱图参数包括色谱图的峰数、位于波形的时间轴的中心附近的峰的位置及相邻的峰彼此间的距离等。色谱图参数用于在色谱图波形中决定峰的位置。
[0085] 如此,提取部34将提取的峰参数及色谱图参数作为真峰波形而输出至GAN执行部36。此外,提取部34也可以基于当前的推定模型121A从实测色谱图数据中提取峰。GAN执行部36执行基于生成对抗网络(GAN:Generat i ve Adversar i a l Networks)的处理。另外,关于GAN的技术例如在国际公开2021/261202号中公开。
[0086] 具体而言,GAN执行部36更新用于生成疑似峰波形的生成器41。GAN执行部36发送与生成器41有关的信息(例如更新后的参数)。因此,GAN执行部36的生成器41与更新部40的生成器41相同。GAN执行部36的处理的详细内容将后述。疑似峰波形用于推定模型121的学习。
[0087] 此外,噪声生成部38基于来自输入部32的空白色谱图数据生成并获取疑似噪声波形(参照上述图4及图5)。在此,疑似噪声波形用于推定模型121的学习。关于噪声生成部38的处理将后述。
[0088] 更新部40生成疑似峰(参见图3的(B))。然后,更新部40通过将该疑似峰与由噪声生成部38生成的疑似噪声相加,生成疑似色谱图。然后,学习装置30将疑似色谱图作为学习数据、将疑似峰作为训练数据而更新推定模型121A。推定模型121A存储在存储部52(参照图7)中。更新部40将更新的推定模型121A发送至数据解析装置25。数据解析装置25将存储在模型存储部114中的推定模型121更新为从学习装置30发送的推定模型121A。因此,推定模型121变得与推定模型121A同步。另外,在采用数据解析装置25与学习装置30一体化的构成的情况下,更新部40更新推定模型121。
[0089] 图7是GAN执行部36与更新部40的功能模块图。GAN执行部36包含随机噪声产生部46、生成器41、数据选择部42、识别器43、判定部44、更新处理部45。使用规定的神经网络作为生成器41及识别器43。该规定的神经网络例如在以下的文献1及文献2中公开。
[0090] 文献1为“A l ec Radford等3人,《Unsuperv i sed Representat ion Learn i ng w i th Deep Convo l ut i ona l Generat i ve Adversar i a l N etworks(深度卷积生成对抗网络的无监督表征学习)》,[在线],[2022年1月26日检索],互联网”。
[0091] 文献2为“I anJ.Goodfe l l ow等8人,《Generat i ve Adversar i a lNets(生成对抗网络)》,[在线],[2022年1月26日检索],互联网”。
[0092] 随机噪声产生部46随机产生噪声,并将该噪声输出至生成器41。此外,从提取部34发送的真峰波形的数据被输入至数据选择部42。
[0093] 生成器41基于来自随机噪声产生部46的噪声及神经网络而生成函数。该函数将时刻(经过时间)作为参数,输出伪峰波形的数据。生成器41通过对所生成的函数输入时刻(经过时间),生成伪峰波形的数据。此外,伪峰波形的数据数量与从提取部34输出的真峰波形的数据数量相同。
[0094] 数据选择部42交替地切换伪峰波形数据与真峰波形数据并输入至识别器43。识别器43识别输入的波形数据是否为真。识别器43将识别结果输出至判定部44。判定部44判定识别结果是否正确。即,该判定为如下判定:确认识别器43在将真峰波形数据输入至识别器43时是否将该数据识别为真、以及在将伪峰波形数据输入至识别器43时是否将该数据识别为伪。
[0095] 更新处理部45基于判定部44的判定结果,更新神经网络的参数(系数),使得生成器41与识别器43的性能分别提高。如此,在GAN中,使生成器41和识别器43相互竞争的同时执行学习以提高各自的性能。具体而言,更新处理部45更新该生成器41中的神经网络的参数,使得生成器41生成高品质的函数。在此,高品质的函数是能够生成尽可能接近真峰波形数据的伪峰波形数据的函数。
[0096] 接着,使用图7对更新部40进行说明。更新部40具有随机噪声产生部46、生成器41、相加部53、学习执行部51与存储部52。如上所述,GAN执行部36的生成器41与更新部40的生成器41相同。换言之,通过GAN执行部36的更新处理部45更新的生成器41也用于更新部40。此外,GAN执行部36的随机噪声产生部46也用于更新部40。
[0097] 如上所述,随机噪声产生部46随机产生噪声,将该随机噪声输出至生成器41。生成器41生成疑似峰波形。该疑似峰波形对应于本公开内容的“峰波形”。如上所述,利用更新处理部45提高生成器41的性能。因此,生成器41能够生成接近真峰波形的疑似峰波形。生成的疑似峰波形被输出至相加部53及学习执行部51。
[0098] 相加部53通过将来自生成器41的疑似峰波形(参照图3的(B))与来自噪声生成部38的疑似噪声波形(参照图3的(A))相加,从而生成疑似色谱图(参照图3的(C))。该疑似色谱图对应于本公开内容的“信号波形”。学习执行部51将疑似色谱图作为学习数据、将疑似峰作为训练数据,更新推定模型121A。
[0099] 然后,学习执行部51将更新的推定模型121A发送至数据解析装置25。数据解析装置25将推定模型121更新为推定模型121A。
[0100] 图8是噪声生成部38的功能模块图。噪声生成部38具有计算部62与判断部64。
[0101] 如上所述,在学习模式中,由用户执行N次空白测量。通过该N次空白测量,数据解析装置25生成N个空白色谱图。计算部62获取来自数据解析装置25的该N个空白色谱图。计算部62使用N个空白色谱图而计算上述L个相关系数。进而,计算部62计算该L个相关系数的平均值。计算出的平均值被输出至判断部64。
[0102] 判断部64判断平均值是否为上述阈值以上。平均值小于阈值的情况是指非设想噪声波形不包含在空白色谱图中的情况(图4)。因此,在该情况下,判断部64获取作为疑似噪声波形的N个空白色谱图。然后,判断部64将疑似噪声波形发送至相加部53。
[0103] 另一方面,平均值为阈值以上的情况是指非设想噪声波形包含在空白色谱图中的情况(图5)。因此,在该情况下,判断部64废弃N个空白色谱图。
[0104] 如上所述,在分析装置35中,有时生成包含能在分析试样S的情况下产生的噪声(设想噪声)的色谱图。因此,如图3所示,在学习模式中,如图3所示地,学习装置30将模拟了设想噪声的疑似噪声与模拟了峰的疑似峰相加,由此生成疑似色谱图。然后,学习装置30基于疑似峰与疑似色谱图而更新推定模型121。由此,与“使用了未反映设想噪声的推定模型的峰检测”相比,能够提高峰检测的精度。
[0105] 此外,在本实施方式中,通过执行N次空白测量,学习装置30生成作为疑似峰的N个空白色谱图。在此,存在由于在空白测量中在测量部10等中混入异物而在该空白色谱图中包含非设想噪声的波形的情况。因此,学习装置30针对N个空白色谱图计算L个相关系数的平均值。然后,在该平均值小于阈值的情况下,学习装置30将N个空白色谱图用作疑似噪声波形。另一方面,在平均值为阈值以上的情况下,学习装置30废弃N个空白色谱图。因此,学习装置30能够判定非设想噪声波形包含在疑似噪声波形中的情况,能够执行与该非设想噪声波形对应的处理。此外,学习装置30自动排除包含非设想噪声波形的疑似噪声波形。因此,能够在不对用户施加负担的情况下抑制推定模型121的品质的降低。
[0106] 此外,设想噪声波形是通过执行不使用试样S的空白测量而生成的。因此,学习装置30能够在不消耗试样S的情况下生成设想噪声波形。
[0107] 此外,类似程度是“N个疑似噪声波形各自的相关系数(L个相关系数)的平均值”。因此,学习装置30能够使用相关系数这样的已知参数来判别非设想噪声波形是否包含在疑似噪声波形中。
[0108] 此外,学习装置30通过GAN获取疑似峰波形。因此,由于能够获取接近真峰波形的疑似峰波形而能够提高疑似峰波形的品质。
[0109] [流程图]
[0110] 图9是示出包含学习装置30的分析系统100的处理的流程图。在步骤S2中,学习装置30生成并获取疑似噪声波形。接着,在步骤S4中,学习装置30生成并获取疑似峰波形。另外,关于步骤S4的带括号内容,在第2实施方式中进行说明。接下来,在步骤S6中,学习装置30通过将疑似噪声波形与疑似峰波形相加而生成并获取疑似色谱图。接下来,在步骤S8中,学习装置30基于疑似峰波形与疑似色谱图而更新推定模型121A(推定模型121)。
[0111] 图10是示出步骤S2的处理的流程图。在步骤S20中,测量部10执行N次空白测量。接着,在步骤S22中,学习装置30计算通过该N次空白测量而得到的N个空白色谱图各自的相关系数(L个相关系数)。接着,在步骤S24中,学习装置30计算该L个相关系数的平均值。
[0112] 然后,在步骤S26中,学习装置30判断平均值是否小于阈值。在平均值小于阈值的情况下(在步骤S26中判断为“是”的情况下),即在非设想噪声不包含在空白色谱图中的情况下,学习装置30获取作为疑似噪声的N个空白色谱图。然后,学习装置30将该疑似噪声(N个空白色谱图)发送至相加部53。
[0113] 另一方面,在平均值为阈值以上的情况下(在步骤S26中判断为“否”的情况下),即在空白色谱图中包含非设想噪声的情况下,学习装置30废弃N个空白色谱图。
[0114] <第2实施方式>
[0115] 在第1实施方式中,对学习装置30通过空白测量获取疑似噪声的构成进行了说明。在第2实施方式中,通过将试样配置于配置部18而对该试样执行规定测量,由此学习装置30获取疑似噪声。试样可以是成分已知的已知试样,也可以是成分未知的未知试样。
[0116] 此处,在通过二维表现由分析装置35生成的信号波形的情况下,第1方向的轴(X轴)表示区间,第2方向的轴(Y轴)表示强度。在本实施方式中,以第1方向的轴表示的区间包含第1区间与第2区间。规定测量是如下测量:在该信号波形中在第1区间中产生基于该试样的峰(以下也称为“实际峰”),另一方面在与该第1区间不同的第2区间中未检测到峰的测量。在第2区间中,检测出设想噪声(以下也称为“实际噪声”)。
[0117] 在分析装置为色谱仪的情况下,信号波形为色谱图,第1区间为第1时间段,第2区间为第2时间段。此外,若分析装置是其他装置(例如X射线分析装置),则信号波形是X射线光谱波形,第1区间是第1能量带,第2区间是第2能量带。此外,第1时间段(第1区间)也被称为峰区间,第2时间段(第2区间)也被称为非峰区间。在本实施方式中,学习装置30将实际峰波形作为疑似峰波形、将实际噪声波形作为疑似噪声波形而更新推定模型121。另外,作为变形例,学习装置30也可以仅基于实际峰波形而更新推定模型121。此外,作为变形例,学习装置30也可以仅基于实际噪声波形而更新推定模型121。
[0118] 规定测量例如是MRM(Mu l t i p l e React i on Mon itor i ng:多反应监测)模式下的测量(以下也称为“MRM测量”)。MRM是如下方法:对于由离子化探针离子化的各种离子,在第1级质量分析部中选择特定的离子(前体离子),在碰撞池中使前体离子解离,进而在第2级质量分析部中从破坏的离子(产物离子)中检测特定的离子的方法。通过化合物编号对该成分进行规定。此外,规定测量也可以是其他的测量,例如也可以是扫描测量。规定测量对应于本公开内容的“噪声测量”。
[0119] 图11是示出规定测量的结果的一例的图。在图11的例子中,示出化合物编号X1、化合物编号X2与化合物编号X3作为能够通过MRM测量鉴定的化合物的编号。
[0120] 在图11的例子中,对应于化合物编号X1的成分通过5.9~6.5的时间段的峰而检测。此外,对应于化合物编号X2的成分通过11.75~12.05的时间段的峰而检测。此外,对应于化合物编号X3的成分通过15.7~16.1的时间段的峰而检测。
[0121] 此外,由于在规定测量中测量的试样是已知试样,因此上述第1时间段(产生实际峰的时间段)与第2时间段(不产生实际峰而产生实际噪声的时间段)是确定的。在该图11的例子中,上述第1区间对应于5.9~6.5的时间段(对应于化合物编号X1的时间段)。此外,上述第2区间对应于15.7~16.1的时间段(对应于化合物编号X3的时间段)。在第1区间中,检测到实际峰P。此外,在第2区间中,检测到实际噪声Q。
[0122] 此外,学习装置30在第2时间段中计算通过N次规定测量而获取的N个色谱图的相关系数的平均值。第2时间段是不产生由已知试样引起的峰的时间段。学习装置30在该平均值小于阈值的情况下判断为未产生非设想噪声。因此,学习装置30获取作为疑似噪声波形的第2时间段的色谱图。另一方面,学习装置30在该平均值为阈值以上的情况下判断为产生非设想噪声。因此,学习装置30废弃作为疑似噪声波形的第2时间段的色谱图。
[0123] 图12是第2实施方式的步骤S2的处理的流程图。此外,关于第2实施方式的学习方法,采用图9的流程图。此外,在第2实施方式中,执行步骤S4的带括号内容的处理。
[0124] 在图12的步骤S42中,测量部10执行N次试样测量(已知试样的测量)。接着,在步骤S44中,学习装置30计算非峰区间中的N个色谱图的相关系数。接着,学习装置30执行步骤S24以后的处理。
[0125] 此外,若步骤S2的处理结束,则学习装置30执行步骤S4的处理。在此,在步骤S4中,学习装置30获取第1区间中的实际峰P的波形作为真峰波形(参照图7)。
[0126] 根据第2实施方式,学习装置30获取作为疑似噪声波形的在第2区间中产生的实际噪声波形Q。然后,学习装置30计算N个实际噪声波形Q的相关系数的平均值(图12的步骤S24)。然后,在步骤S26中,学习装置30判断平均值是否小于阈值。在步骤S26中判断为“是”的情况下,在步骤S28A中,获取作为疑似噪声波形的在步骤S42中获取的N个色谱图。另一方面,在步骤S26中判断为“否”的情况下,在步骤S30A中废弃该N个色谱图。如此,学习装置30基于该平均值判断非设想噪声波形是否包含在疑似噪声波形中。因此,学习装置30能够在与分析试样的情况相同的状况下生成疑似噪声波形。因此,能够提高疑似噪声波形的品质。
[0127] 此外,学习装置30获取实际峰波形P作为疑似峰波形。因此,学习装置30能够有效利用能与实际噪声波形共同获取的实际峰波形。
[0128] <第3实施方式>
[0129] 在第1实施方式或者第2实施方式中,对在图10或者图12的步骤S26中,在平均值为阈值以上的情况下(步骤S26中为“否”),学习装置30自动地废弃N个空白色谱图的构成进行了说明。但也可以是,在平均值为阈值以上的情况下(步骤S26中为“否”),学习装置30向用户通知类似程度(相关系数的平均值)为阈值以上这一情况。该通知例如通过在显示装置65上显示规定图像而实现。
[0130] 图13是规定图像的一例。在图13中,示出在显示装置65的显示区域62A中显示规定图像的例子。在图13的例子中,显示有“相关系数的平均值为阈值以上。”这样的语句的规定图像。通过由学习装置30显示该规定图像,能够使用户识别相关系数的平均值为阈值以上这一情况,即在疑似噪声波形中包含非设想噪声波形这一情况。因此,用户能够通过对输入装置61输入规定命令(通过用户的手动)而排除疑似噪声波形。此外,用户能够视觉辨认包含非设想噪声的疑似噪声波形。
[0131] [方案]
[0132] 本领域技术人员可以理解,上述多个示例性的实施方式是以下的方案的具体例。
[0133] (第1项)一方案的学习方法为进行推定模型的学习的学习方法,该推定模型用于检测由分析试样的分析装置生成的信号波形的峰。学习方法包括:获取能在分析装置执行分析处理的情况下产生的噪声波形;基于噪声波形学习推定模型。此外,获取噪声波形包括:获取由分析装置多次执行的噪声测量所生成的多个噪声波形;计算多个噪声波形的类似程度;执行与类似程度对应的规定处理。
[0134] 根据这样的构成,能够判定非期望噪声波形包含在噪声波形中的情况,能够执行与该噪声对应的处理。
[0135] (第2项)在第1项所述的学习方法中,执行规定处理包括获取类似程度小于阈值的多个噪声波形。规定处理包括废弃类似程度为阈值以上的多个噪声波形的处理。
[0136] 根据这样的构成,能够自动排除包含非期望噪声波形的噪声波形。因此,能够在不对用户施加负担的情况下抑制推定模型的品质的降低。
[0137] (第3项)在第1项或者第2项所述的学习方法中,规定处理包括对用户通知类似程度为阈值以上这一情况的处理。
[0138] 根据这样的构成,能够使用户识别类似程度为阈值以上这一情况。
[0139] (第4项)在第1项~第3项的任1项所述的学习方法中,噪声测量是在未对分析装置配置试样的状态下由分析装置进行分析的空白测量。
[0140] 根据这样的构成,能够在不消耗试样的情况下生成噪声波形。
[0141] (第5项)在第1项~第3项的任1项所述的学习方法中,噪声测量是如下测量:通过由分析装置对成分为已知的已知试样进行分析,在信号波形的第1区间中产生实际峰波形。获取噪声波形包括获取在未检测到实际峰的第2区间中产生的实际噪声波形作为噪声波形。
[0142] 根据这样的构成,能够在与分析试样的情况相同的状况下生成噪声波形。因此,能够提高噪声波形的品质。
[0143] (第6项)在第5项所述的学习方法中,对推定模型进行学习包括基于实际峰波形与噪声波形而对推定模型进行学习。
[0144] 根据这样的构成,能够有效利用能与实际噪声波形共同获取的实际峰波形。
[0145] (第7项)在第1项~第6项的任1项所述的学习方法中,类似程度是该多个噪声波形各自的相关系数的平均值。
[0146] 根据这样的构成,能够使用相关系数这样的已知参数来判别非期望噪声波形是否包含在所获取的噪声波形中。
[0147] (第8项)在第1项~第7项的任1项所述的学习方法中,包括:获取不包含噪声波形的峰波形;通过将噪声波形与峰波形相加而生成信号波形,对推定模型进行学习包括基于信号波形而对推定模型进行学习。
[0148] 根据这样的构成,能够对与分析未知试样的情况下进行生成的状况相同的状况(生成信号波形这一状况)下的推定模型进行学习。
[0149] (第9项)在第8项所述的学习方法中,利用生成对抗网络而获取峰波形。
[0150] 根据这样的构成,能够提高峰波形的品质。
[0151] (第10项)一方案的学习程序是使计算机执行推定模型的更新的学习程序,该推定模型用于检测由分析试样的分析装置生成的信号波形的峰。学习程序使计算机执行:获取能在分析装置执行分析处理的情况下产生的噪声波形;基于噪声波形学习推定模型。获取噪声波形包括:获取由分析装置多次执行的噪声测量所生成的多个噪声波形;计算多个噪声波形的类似程度;执行与类似程度对应的规定处理。
[0152] 另外,对于上述的实施方式及变形例,在不产生不妥或者矛盾的范围内,从申请最初就预定了包括未在说明书中提及的组合在内的、在实施方式中说明的构成的适当组合。
[0153] 以上对本发明的实施方式进行了说明,但应认为此次公开的实施方式在所有方面均为例示而并非限制性的内容。本发明的范围由权利要求书示出,还旨在包括与权利要求书等同的意思及范围内的所有变更。

当前第1页 第1页 第2页 第3页