技术领域
[0001] 该描述通常涉及将输入集的生产速率与下游需求速率相匹配,尤其涉及改进生产网络的通量平衡分析表示的目标函数。
相关背景技术
[0002] 细胞的代谢可以表示为分子之间的链接的反应路径集,其中反应的化学计量系数作为代谢系统产生代谢生产的能力的约束。化学计量系数可以用作代谢的通量平衡分析(Flux Balance Analysis,FBA)表示中的约束。FBA对代谢系统的稳定状态行为进行求解,在代谢系统的边界产生输入和输出通量集。输入通量值表示代谢吸收反应物的速率,而输出通量值表示代谢提供产物的速率。
[0003] 在传统的“纯”FBA下,人们假设FBA模拟的行为是封闭系统,使得每个分子的生产和消耗都在代谢网络的内部。因此,在传统的FBA中,生产与消耗完全匹配,导致分子输入和输出通量之间严格的质量(mass)平衡要求。然而,纯FBA代谢并不包含明显的控制点,其中从这些控制点来调整生产以调节FBA之外的任何实际需求。这个问题因纯FBA与时间无关而变得更加复杂,使得通量值在一次单独计算中求解,从而避免了为满足外部需求而对纯FBA生产进行时间相关的调整。调节FBA的常规解决方案包括人为限制代谢的输入,然而这并没有提供一种方式来使代谢速率与细胞内的实际需求相匹配,这反映在整个细胞模型的多个子单元中。
具体实施方式
[0012] I.场境
[0013] 为了将代谢系统的行为公式化为优化问题,代谢系统可以表示为分子之间的链接的反应路径集,其中反应的化学计量系数作为对代谢系统产生代谢产物的能力的约束。这些化学计量约束由元素平衡和电荷平衡确定,并且完全与时间无关。得到的稳定状态行为的方程组也是时间无关的。在“纯”FBA模型中,其中假设生产和消耗被包含在代谢网络的封闭系统中,可以写出质量平衡方程组,使得生产与消耗完全匹配。这些线性方程表示了分子输入通量和输出通量之间严格的质量平衡要求。通过将每个分子对反应网络的比例贡献(即输入通量值和输出通量值)相加,形成目标函数。生物学上,目标函数表示系统的总生物量。通过假设细胞将最大化生长(即最大化总生物量),可以通过在给定化学计量反应约束的情况下最大化目标函数的单个值来求解通量值。这导致了进出代谢系统的所有分子通量值的精确解。因为在FBA模型之外不存在代谢物的纯FBA生产和消耗,所以使用仅由输入通量值和输出通量值形成的目标函数是合理的。在封闭的FBA系统中,目标函数是对支配系统的力量(供应通量和需求通量)的详尽描述。
[0014] 通量平衡分析(FBA)是建模代谢系统的强大工具,因为FBA允许在不知道中间的动态行为的情况下求解系统的稳定状态行为,并且部分结果是比时间相关的动态模型在计算上成本更低。这些因素使得FBA成为很有吸引力的代谢行为的公式化。
[0015] 然而,并不是所有的细胞过程都具有有利于FBA公式化的行为,并且为了建立全细胞模型的模拟,FBA代谢与其他子单元相互作用,这些子单元可能在FBA网络中具有该子单元自己的一些相同分子的生产和消耗。这些子单元模拟代谢的外部过程,并为全细胞模型做出贡献。全细胞模型可以被概念化为生产网络,在这个网络中,分子在相互联系的供应和需求网络中的多个子单元之间被生产、消耗和转移。将供应和需求的外部化到FBA系统之外的其他子单元,打破了封闭系统以及纯FBA的质量平衡假设。纯FBA不包含明显的控制点,其中从这些控制点可以将代谢物的生产速率(即通量值)调整到FBA之外的实际需求,如其他子单元中代谢物的消耗所反映的那样。这个问题因纯FBA与时间无关而变得更加复杂,使得通量值可以在单个一次(one-time)计算中求解,从而避免了为满足外部需求而对纯FBA进行与时间相关的调整。传统的调节FBA的方法包括人为地限制代谢的输入,然而这并不能提供一种方式来使代谢速率与细胞的生产网络内的实际需求相匹配。
[0016] 为了将FBA集成到更大的生产网络中,本描述改进了FBA目标函数,以提供更准确地反映供应和需求的动态变化的假设和控制的集合,允许使用FBA来简化生产网络的计算,而不会牺牲网络内生产和消耗的实际平衡调节的准确度。具体而言,将优化目标从最大化生产或生长(例如,最大化输出通量值)调整到给定其他子单元内的供应和需求的规定的生长,表示了从“最大化生产”到分子通过生产网络运动的“精益生产”框架的转变。
[0017] 因此,改进的FBA的一个基本假设是最大化生长或生产,由最大化“生物量”目标函数表示。在纯FBA中,目标函数最大化意味着所有可用的反应物被转化为尽可能最大量的产物。这也意味着除了固定的化学计量约束之外,仅有的生产约束是输入通量值或产物的可用性。然而,实际上,FBA代谢不仅受可利用的反应物的量的调节,还受给定产物被其他生物学过程消耗的量的调节,或者已经存在于生产网络的其他地方。此外,在某一点上,生产和细胞生长速率不是受输入的供应限制,而是受生物过学程中固有的限制,诸如最大RNA伸长率、多肽伸长、细胞壁组件等。这将限制细胞的生长并对生产网络施加限制。因此,纯FBA本质上只允许对生产进行上游控制,而细胞同时参与上游和下游控制,并且对细胞的生长速率也有固有的限制。
[0018] 通过改进目标函数,FBA的生产可以被匹配以满足实际需求,由其他子单元中代谢物的生产和消耗的速率以及细胞中储备的代谢物的浓度来表示。此外,随着时间相关的外部子单元的每个时间步,目标函数可以用新的初始条件迭代更新,以将FBA重塑为代谢的动态响应公式。通过与真实生命中的细胞行为进行比较,可以验证对目标函数的改进,以确定所得的交换通量和推断的细胞生长速率是否具有生物学意义。
[0019] II.子单元系统内的FBA代谢
[0020] 图1是示出根据一个实施例的改进的FBA系统100的框图。在改进的FBA系统100中,FBA代谢110与上游子单元102和下游子单元114连接。在上游子单元102内,可以有任意数量的单独的子单元,诸如第一子单元104至第N子单元106,其中N是上游子单元的总数。在下游子单元114内,还存在任意数量的单独的子单元,诸如第一子单元116至第M子单元118,其中M是下游子单元的总数。FBA代谢110的生产速率由输出通量数据集112给出。代谢的原始输入(raw input)的供应速率由输入通量数据集108给出。上游子单元102产生代谢的原始输入,使得原始输入被传送到FBA代谢110的速率部分地由上游子单元102内的生产速率确定。下游子单元114消耗代谢的产物,并通过下游调节120来调整FBA代谢110内的生产。因此,FBA系统100是相互连接的供应和需求的系统,其中FBA代谢被调节以部分由上游子单元102限制并部分由下游子单元114驱动的速率产生分子。
[0021] A.子单元
[0022] 在改进的FBA系统100中所示的上游子单元和下游子单元(分别为102和114)表示代谢外部的生物学过程。例如,上游子单元102和下游子单元114可以表示转录(transcription)、翻译(translation)、细胞通信(cellular communication)、细胞繁殖(cellular reproduction)、细胞运输(cellular transport)等。这些子单元中的每一个都包含自己的反应网络,其中该反应网络将子单元所表示的特定生物学过程的输入分子转化为作为细胞过程的产物的输出分子。因此,每个子单元都包含自己的分子生产和消耗的系统。
[0023] 在上游子单元102中,每个单独的子单元(第一子单元104至第N子单元106)的产物被用作FBA代谢110的原始输入。例如,如果第一子单元104表示翻译,它可以接受作为输入的mRNA和rRNA,并输出各种多肽。然后这些多肽可以是代谢的输入,并且在输入通量数据集108中具有输入通量值。因此,在输入通量数据集108中具有输入通量值的分子可以是由上游子单元102表示的细胞过程的产物。
[0024] 类似地,在下游子单元114中,在输出通量数据集112中具有输出通量值的FBA代谢110的产物被用作由单独的下游子单元表示的下游细胞过程的原始输入。例如,如果FBA代谢110产生ATP,这可以用作由第一子单元116表示的细胞运输的输入。因此,ATP在输出通量数据集112中具有输出通量值,其中该输出通量值被传送到第一子单元116。
[0025] 在一些示例中,上游子单元102和/或下游子单元114可以包含既是对FBA代谢110的输入又将FBA代谢110的产物用作原始输入的分子。在这些示例中,子单元可以被分类为上游子单元102和下游子单元114两者。例如,对翻译进行建模的子单元可以消耗由FBA代谢110产生的氨基酸(例如,该子单元是下游子单元114),并生成用作FBA代谢110的输入的多肽(例如,该子单元也是上游子单元114)。
[0026] 子单元作为上游子单元102和/或下游子单元114的指定不是静态指定,并且可以在模拟FBA系统100期间响应FBA系统100内的供应和需求变化而改变。例如,如果第一子单元116内存在对FBA代谢110的输出的需求,则第一子单元116可以被认为是下游子单元114之一。然而,如果需求减少,并且第一子单元116的产物积累过量,则第一子单元116可能成为上游子单元102之一,并且其过量产物输入到FBA代谢110并被其分解。
[0027] 上游子单元102和下游子单元114中的子单元是它们所表示的细胞过程的数学模型。这些数学模型模拟了每个子单元内分子的生产和消耗系统。上游子单元102和下游子单元114可以是蒙特卡罗模型,用偏微分方程(partial differential equation,PDE)系统、常微分方程(ordinary differential equations,ODE)系统、FBA、速率动力学、数值近似或能够描述细胞过程或多变量系统行为的任何其他数学公式来建模。上游子单元102和下游子单元114中的至少一个子单元可以是时间相关的。
[0028] 虽然每个子单元可以具有唯一的数学公式,但是每个子单元限制了分子的集合,这些分子是通过子单元建模的反应和过程的集合中的输入、产物或中间体。每个子单元隐含地(如在PDE、ODE和蒙特卡罗模型中)或明确地(如在FBA或速率动力学模型中)包含速率的集合,其中子单元以这些速率输入原始输入和输出产物。在一些示例中,隐含的需求速率可以由分子的现有浓度和未来时间步(time step)中的预计浓度之间的差来确定。出于改进的FBA系统100的目的,与FBA代谢110相关的上游子单元102和下游子单元114的行为是子单元中的每一个内反应物到产物的转化速率,因为这是可转化为控制FBA的术语的主要值(例如,通量值)。对于每个子单元,输入的摄入速率表示输入分子中的每一个的需求,而产物的输出速率表示输出分子中的每一个的供应。如上所述,分子是上游子单元102、FBA代谢110和下游子单元114的系统所共有的。例如,ATP可以用于所有上游子单元102、FBA代谢110和所有下游子单元114。总的来说,所有上游子单元的输出表示FBA代谢110的输入分子的供应速率。因此,上游子单元102的产物的输出速率部分地定义了输入通量数据集108的输入通量值。
[0029] 类似地,总的来说,下游子单元114接收FBA代谢110的输出产物的速率给出了下游对FBA代谢110的产物的需求的速率。为了调整FBA代谢110的生产速率,下游调节120通过改进FBA代谢110的目标函数来反馈到FBA代谢110。参考图3进一步详细描述该过程。
[0030] 除了上游供应和下游需求之外,还可以基于细胞内分子的现有浓度来调节FBA代谢110。例如,在上游子单元102的反应网络内,可能存在可用于每个子单元内的反应网络的分子浓度。这些现有的浓度将影响供应和需求,因为反应速率依赖于浓度,因此产物的积累将导致分子通过反应途径的速率降低。相反,低浓度的分子可能导致通过反应途径的通量增加。分子的现有浓度可以在上游子单元102和下游子单元114内计算,以及在细胞内分子的表示性“存储”内计算。参考图2进一步详细描述了这种“存储”。
[0031] B.确定输入通量数据集和输出通量数据集
[0032] 因此,FBA代谢110在位于上游子单元102和下游子单元114内的更大的供应和需求系统内运行,其最终影响包含代谢系统的FBA公式的通量值解的输入通量数据集108和输出通量数据集112。为了求解输入通量数据集108和输出通量数据集112,定义了描述FBA代谢110中每个分子的化学计量反应约束的方程组。每个分子的通量值(例如,FBA代谢110的输入供应和FBA代谢110的输出生产)是未知的,并且通过将改进的加权通量值求和以产生目标函数来求解。给定方程组的约束,目标函数然后被最大化。求解最大化问题产生通量值解的集合,其中通量值解构成输入通量数据集108和输出通量数据集112。给定上游子单元102和下游子单元114内的现有供应和需求,输入通量数据集108和输出通量数据集112的通量值解表示FBA代谢110的稳定状态行为。参考图3进一步详细描述该过程。
[0033] III.具有改进的FBA代谢的示例性全细胞模型
[0034] 图2是根据一个实施例的具有FBA代谢206的全细胞模型200的框图。全细胞模型200是如图1所示的改进的FBA系统100的示例。因此,上游子单元102和下游子单元114可以是细胞修复子单元202、复制子单元204、基因表达子单元208和/或细胞通信子单元210中的任何一个。通向FBA代谢206的箭头表示FBA代谢206之间的输入通量值和/或输出通量值。子单元和FBA代谢206之间的箭头也可以表示从这些子单元到FBA代谢206的分子供应和/或FBA目标函数上的子单元的调节。
[0035] 如图2所示,箭头从子单元通向FBA代谢206,并从FBA代谢206通向子单元。这是一个事实的例证,即许多细胞过程包含分子和反应途径,它们都是FBA代谢206的输入,并且由FBA代谢产生。因此,如图2所示的子单元可以是参考图1所描述的上游子单元和下游子单元。子单元和FBA代谢206之间的相互作用可以由聚集全细胞模型200内的变化的单个数据集来协调,使得子单元和FBA代谢206中的每一个接收信息并将信息传输到单个数据集,而不是彼此传输该信息。该单个数据集可以是状态数据集,并且将参考图3进一步详细描述。
[0036] A.分子缓冲物(cushion)
[0037] 除了子单元内的分子浓度和FBA代谢206之外,全细胞模型200还可以包括分子缓冲物212,其中该分子缓冲物212补充由子单元和FBA代谢206之间的供应和需求系统产生的分子浓度。分子缓冲物212表示细胞环境内的分子储备。例如,分子缓冲物212可以是存在于细胞的细胞质内的分子,并且在需要时可用于分子过程。分子缓冲物212包含不同分子的不同储备浓度。例如,第一分子(molecule1)可以具有浓度molecule1浓度214。如果molecule1是在子单元和FBA代谢206的系统内具有大通量值或需求的分子,那么molecule1的储备浓度可以大于具有更小需求的其它分子。因此,分子缓冲物212内的分子浓度可以与和FBA代谢中的分子相关联的通量值、子单元内的分子的总需求、和/或子单元和FBA代谢206的系统内的需求的任何其他测量值成比例。分子缓冲物212确保对全细胞模型200内的分子的需求的突然增加不会导致全细胞模型200内的分子的完全耗尽。
[0038] 分子缓冲物212内可以有任意数量的分子。由moleculeN浓度214表示的总共N个分子被指定为分子缓冲物212内的储备浓度。在一些示例中,全细胞模型200内的所有分子被分配了分子缓冲物212内的储备浓度。在其他示例中,需求和/或通量值高于阈值的分子被分配分子缓冲物212内的储备浓度,使得全细胞模型200内表示分子主流量的分子子集存储在分子浓度molecule1浓度214至moleculeN浓度214中。
[0039] 如参考图3进一步详细描述的,分子缓冲物212内的任何分子的储备浓度可以由全细胞模型200的任何子单元或其他组件通过状态数据集访问,其中状态数据集包括分子浓度数据集306和336。
[0040] 分子缓冲物212对全细胞模型200的影响在于,分子缓冲物浓度允许对分子的需求瞬间(例如,对于评估子单元的给定单个时间步)超过供应,而不破坏全细胞模型200。这允许生产网络在需求负载被施加到全细胞模型200的系统时继续运行,给细胞时间来增加分子的生产以满足新需求。该过程参考图4进行说明。
[0041] IV.改进的FBA时间序列
[0042] 图3是根据一个实施例的使用FBA代谢的时间序列的框图。初始状态302在T=t0处建立。在初始状态302之后,通过将初始状态数据集304输入到上游子单元312、下游子单元318和FBA代谢324中来确定第一后续状态332。FBA代谢324产生解通量值的集合,其中该解通量值从FBA代谢输出作为FBA通量数据集342。FBA通量数据集342与上游子单元312和下游子单元318的解相结合,以产生后续状态数据集334。后续状态数据集334是初始状态数据集
304的更新。这个后续状态数据集334是在第一时间步T=t1处FBA系统中的条件的表示。后续状态数据集334被输入到上游子单元346、下游子单元352和FBA代谢358中,以在T=t2处产生下一个时间步。
[0043] A.初始状态数据集
[0044] 初始状态数据集304包含分子浓度数据集306、上游供应308和下游需求310。上游供应308和下游需求310是相对于横跨全细胞系统(诸如改进的FBA系统100和/或全细胞模型200)的生产网络内的FBA代谢的位置来测量的。因此,“上游”指的是所有子单元和子单元内的反应途径,其中该子单元产生被用作FBA代谢324的输入的产物。“下游”是指所有子单元和子单元内的反应途径,其中该子单元使用FBA代谢324的产物作为输入反应物。在一些示例中,子单元和子单元内的反应路径可以包含既用作FBA代谢324的输入又是FBA代谢324的产物并被子单元用作输入反应物的分子。“供应”和“需求”分别指上游子单元和下游子单元中分子浓度的变化的速率。对于包含描述分子量的可微函数的子单元,供应或需求可以指子单元内的分子的数量变化的微分速率。对于基于子单元内的分子的行为的统计或数值近似的子单元,“供应”和“需求”可以指子单元内的分子的数量的变化的数值近似或推断速率。在初始状态数据集304内,为FBA代谢324、上游子单元312和下游子单元318内的每个分子初始化这些值,以模拟生产网络的起始条件。
[0045] 初始状态数据集304还包括分子浓度数据集306。分子浓度数据集306包括上游子单元312、下游子单元318、FBA代谢和分子缓冲物浓度(诸如参考图2描述的分子缓冲物212)中的每一个内的每个分子的初始浓度。因此,初始状态数据集304的分子浓度数据集306设置分子缓冲物212的初始浓度、以及上游子单元312和下游子单元318中的每一个内的初始浓度。分子浓度数据集306表示每个分子的初始化的“积分”量,使得初始浓度数据集306为细胞模型构建人造“历史”,表示在T=t0之前“发生”的先前的行为、生长、生产等。可以调整这些初始值,以模拟不同培养基和细胞外环境中的细胞生长和行为。
[0046] 初始状态数据集304还包括固有速率参数328。固有速率参数328是在初始状态302定义的,并且被用作FBA代谢324内的参数,并且在下面结合FBA代谢324进一步讨论。
[0047] 初始状态数据集304可以附加地包括初始化上游子单元312、下游子单元318和FBA代谢324内的变量所需的任何其他数据,包括但不限于边界条件、除分子浓度之外的初始值、以及数值模拟的迭代的次数。
[0048] 初始状态数据集304和任何后续状态数据集(诸如后续状态数据集334)有效地协调了FBA代谢324、上游子单元312和下游子单元318的生产网络内的供应和需求。因此,上游子单元312、下游子单元318和FBA代谢324不需要链接在一起,而是可以通过状态数据集进行交互。因此,由上游子单元312或下游子单元318中的任何一个产生的生产网络中的任何变化通过状态数据集中的更新被传送到FBA代谢324。类似地,由FBA代谢324产生的生产网络中的任何变化通过状态数据集中的更新被传送到上游子单元312和下游子单元318。
[0049] B.第一时间步
[0050] 初始状态数据集304被输入到上游子单元312、下游子单元318和FBA代谢324,从而初始化改进的FBA系统,诸如改进的FBA系统100和/或全细胞模型200。给定初始状态数据集304内的信息,可以完全模拟每个上游子单元(诸如子单元314至子单元N 316)和每个下游子单元(诸如子单元320至子单元M 322)内表示的系统,产生解的集合,其中这些解表示给定初始状态数据集304内定义的初始条件的子单元内的每个元素的后续状态。
[0051] 上游子单元312和/或下游子单元318的子集可以是时间相关的。在时间间隔t1–t0内的第一后续状态332处确定这些子单元的解。上游子单元312和下游子单元318的剩余子集是时间无关的。对于这些子单元,使用T=t0的初始状态302处的初始状态数据集304内的初始条件找到时间无关的解。因此,在FBA时间序列300内表示为第一后续状态332和初始状态302之间的t1–t0的时间间隔被解释为对T=t0处的初始条件的时间无关解。FBA代谢324也是这种情况。
[0052] IB.FBA代谢中的时间
[0053] 尽管代谢的FBA公式是时间无关的,但是在FBA模型中存在隐含的“时间”变量。这个“时间”隐含在FBA的稳定状态假设中,意味着FBA解的通量值被假设为对应于每个分子的通量值的中间波动已经结束并且整个系统已经达到稳定状态的未定义时间。稳定状态假设通常假设发生在时间相关函数的t→∞处。然而,为了在时间序列内使用代谢的FBA公式,可以调整稳定状态假设,以假设通量值解不出现在t→∞处,而是FBA代谢324可以在时间间隔t1–t0内达到稳定状态。为了模拟从t0到t1的时间步之间的时间间隔,将分子浓度数据集306、上游供应308、下游需求310和固有速率参数328作为初始条件输入到FBA代谢324中。因此,作为这些输入的结果,得到的通量值解是FBA代谢324达到稳定状态平衡的结果,这可以被解释为FBA代谢324在时间间隔t1–t0达到稳定状态。
[0054] 这个相同的假设可以用于其他时间无关的子单元,使得T=t0的初始条件被输入到时间无关的数学模型中,并且得到的解被解释为对应于T=t1,其中在T=t1处,在给定T=t0处的条件下,子单元内分子的生产和消耗系统已经达到稳定状态。
[0055] IIB.生长速率受限目标函数
[0056] 为了构建生长速率受限目标函数,FBA从代谢网络的重建开始,其中该代谢网络描述了代谢内的每个产物和反应物之间的关系(未示出)。该网络重建包括代谢的每个分子和过程,然而不是代谢的所有分子和反应物都可以用于求解FBA代谢324和/或初始生长速率受限目标函数330。然后,代谢网络重建被转换成化学计量矩阵326。化学计量矩阵326是代谢的反应途径中分子之间的每个反应的化学计量系数的矩阵。这些化学计量系数由元素平衡和电荷平衡确定,并且与时间无关并在FBA代谢的迭代求解之间不变。化学计量矩阵326用作对FBA代谢的产物的反应约束的集合。化学计量反应矩阵的列表示代谢内的j个反应中的每一个,而行表示代谢中的i个分子中的每一个。因此,化学计量矩阵中的每一项是代谢的第j反应中的第i分子的化学计量系数。化学计量矩阵的示例如下所示:
[0057]
[0058] 在j个反应中的每一个中,分子具有“通量值”,该“通量值”意味着分子通过反应“表面”的净运动。假设FBA代谢324内的每个分子的质量平衡,并由矩阵方程得出一组线性方程:
[0059]
[0060] 其中变量v1至vj中的每一个是j个分子中的每一个的未知通量值。下面给出了一组示例性线性方程组,它们是从上述矩阵乘法得到:
[0061] c11v1+c12v2+…=0
[0062]
[0063] 在常规的FBA代谢中,这些方程将被加在一起以产生目标函数:
[0064]
[0065] 然而,如前所述,该目标函数具有许多限制,并且不能反映上游子单元312和下游子单元318内的供应和需求。因此,除了上述总和之外,初始生长速率受限目标函数330还包括FBA代谢324内的每个分子的目标值集。目标值将固有速率参数328、上游供应308、下游需求310和分子浓度数据集306结合到给定每个分子的供应、需求和“现有(on-hand)”浓度的分子目标浓度的测量中。目标值可以是正值或负值。出于单元转换的目的,目标值可以被包括在目标函数中,并与通量值进行比较,目标值以速率给出。
[0066] 目标值部分地由在总生产网络(诸如改进的FBA系统100和/或全细胞模型200)的所有子单元内测量的“净”需求来定义,其中在总生产网络中,FBA代谢运行。第一后续状态332的净需求是下游需求310和上游供应308之间的差。在后续的迭代和时间步中,净需求将是后续状态数据集的下游需求和上游供应(诸如后续状态数据集334的上游供应338和下游需求340)之间的差。
[0067] 此外,目标值可以部分地由“现有量”来定义,该“现有量”表示可立即用于FBA代谢324内的反应途径的分子的浓度。在一些实例中,这是由分子浓度数据集306定义的存在于FBA代谢和上游子单元和下游子单元的生产网络内的每个分子的浓度。在其他示例中,这是分子浓度数据集306内的分子浓度与如参考图2进一步详细描述的分子缓冲物212内的缓冲物浓度(诸如molecule1浓度214)之间的差。为了将“现有量”转换为速率,这些值除以时间间隔。
[0068] 目标值进一步由固有速率参数328的集合定义。固有速率参数328表示代谢生产的生物学限制。例如,由于细胞过程的固有速率、分子的运输、酶或促进分子的有限结合速率、或任何其他独立于分子浓度的生物速率限制,细胞可能不能瞬时增加其生产速率以满足下游需求。除了由化学计量矩阵326表示的化学计量反应约束之外,固有速率参数328还表示对代谢生产的内在约束。固有速率参数328是时间无关的系数的集合。如下所述,固有速率参数328限制了生产的“导数”响应、生产的“积分”响应、以及FBA代谢对外部需求的生产的“二阶导数”响应。其他固有速率参数328可以限制生产的“比例”响应,或者生产的任何高阶导数响应。
[0069] 例如,固有速率参数是“惯性(inertia)”,其表示FBA代谢324可以向反应提供分子的固有速率。“惯性”是FBA代谢324内的代谢生产的“二阶导数”限制,因为它表示FBA代谢324内生产的瞬时“当前”变化速率的限制,并因此限制了变化速率本身可调节的速率。“惯性”对细胞能够产生代谢的输出的速率有抑制作用。
[0070] 第二固有速率参数是“补给(replenishment)”,其表示固有速率,其中在该固有速率下,FBA代谢可以生成分子的供应以满足外部需求。“补给”是衍生控制的形式,因为它作用于分子的外部需求速率和内部消耗速率之间的差。补给功能是检查上游供应对下游需求的敏感度。
[0071] 固有速率参数的第三个示例是分子的“半衰期(half-life)”,其表示FBA代谢内的分子的固有消耗速率。“半衰期”是代谢生产的“整体”限制,因为“半衰期”表示了FBA代谢内的分子的先前的生产。
[0072] 可以为FBA代谢内的每个分子定义固有速率参数,使得每个分子具有其自身的“惯性”、“补给”和“半衰期”、或反映在代谢的化学反应中使用该分子作为反应物的生物学限制的任何其他定义的固有参数速率。在一些示例中,应用于相同分子的不同固有速率参数可以用于不同的子单元,并且与上游子单元312和/或下游子单元318相比,不同的固有速率参数的集合可以用于FBA代谢324。在一些示例中,相同的固有速率参数的集合用于FBA代谢324、上游子单元312和下游子单元318中的相同分子。在这个示例中,固有速率参数328是“全局变量”,并且适用于跨所有子单元和FBA代谢324的分子。固有速率参数用于确定目标值,其中利用该目标值修改等式4中的目标函数,并产生初始生长速率受限目标函数330。参考图4进一步详细描述了固有速率参数328分别影响FBA代谢324的代谢生产对上游子单元
312和下游子单元318内的需求的响应的方式的示例。
[0073] 对于FBA代谢324中的每个分子,目标值被计算并结合到等式4的目标函数中,以产生初始生长速率受限目标函数330。这可以是计算目标值和每个分子的比例通量贡献之间的绝对差值的形式。这可以是以按比例缩放每个分子的通量贡献的形式。这可以是以增加每个分子的比例通量贡献的形式。可以使用每个分子的比例通量贡献的任何其他数学修改,其通过目标值来调整该值。作为示例,初始生长速率受限目标函数330可以是以下形式:
[0074]
[0075] 其中targeti是每个第i分子的目标值,比例通量贡献项ki vi通过找出它和计算的目标值之间的绝对差值来被修改。每个分子的比例通量贡献的目标值修改可以是如参考图1进一步详细描述的FBA代谢110的下游子单元114的下游调节120。
[0076] 基于在初始状态302提供的初始状态数据集304来计算初始生长速率受限目标函数330。初始生长速率受限目标函数330后续针对FBA代谢324内的分子的每个通量值vi求解。在一些示例中,通量值vi的数量可以小于FBA代谢324的重建代谢网络内的分子的总数。FBA代谢324的解构成FBA通量数据集342。FBA通量数据集342可以包括如参考图1进一步详细描述的输入通量数据集108和输出通量数据集112。
[0077] IVB.上游和下游子单元
[0078] 初始状态数据集304包含N个上游子单元312中的每一个和M个下游子单元318中的每一个的初始条件。使用来自在T=t0处的初始状态302的这些初始条件,在T=t1的第一后续状态332处求解N个上游子单元312中的每一个和M个下游子单元318中的每一个的解。求解上游子单元312和下游子单元318可能需要运行蒙特卡罗模拟、求解ODE、PDE的系统、使用迭代数值方法、或为多变量系统导出数学解的任何其他形式。对上游子单元312和下游子单元318的解被包括在后续状态数据集334中。
[0079] 在求解上游子单元312和下游子单元318之后,确定后续状态数据集334。从初始状态数据集304更新分子浓度数据集336,以在第一后续状态332包括存在于上游子单元312、下游子单元318和FBA代谢324中的分子浓度。此外,上游供应338和下游需求340根据对上游子单元312和下游子单元318的解来计算。在上游子单元312和下游子单元318中的每一个内,对于子单元内的每个分子,存在瞬时或近似的变化速率。这个变化速率可以是一个微分值,或者可以是数值近似值。这些瞬时的或近似的变化速率被聚集用于FBA代谢内的每个分子,以产生上游供应308和下游需求310的测量。因此,对于FBA代谢内的每个分子,可以存在从对上游子单元312的解中导出的上游供应338值,以及从对下游子单元318的解中导出的下游需求340值。
[0080] 因此,后续状态数据集334代替初始状态数据集304作为具有FBA代谢的生产网络内的“条件”的完整描述符。后续状态数据集334被用作生产网络的下一个时间步的初始条件。
[0081] C.第二时间步
[0082] 在第二后续状态344中,使用与第一后续状态332中相同的上游子单元312、下游子单元318和FBA代谢324。上游子单元312(子单元314至子单元N 316)内的子单元与第一后续状态332中的相同,与下游子单元318(子单元320至子单元M 322)内的子单元也相同。化学计量矩阵326和固有速率参数328与第一后续状态332中使用的相同。因此,子单元和FBA代谢324的所有方面跨生产网络的连续时间步保持相同,除了用于找到对上游子单元312、下游子单元318和FBA代谢324的解的生长速率受限目标函数的更新和初始条件。
[0083] 如前所述,初始生长速率受限目标函数330由每个分子的比例通量值贡献的求和组成,其中该比例通量贡献由目标值集修改。使用后续状态数据集334,为FBA代谢324内的每个分子计算新的目标值集。因此,初始生长速率受限目标函数330被修改以产生后续生长速率受限目标函数346。因此,在时间步T=t1和T=t2之间,FBA代谢324被修改以反映生产网络内的不同条件,如初始状态数据集304和后续状态数据集334之间的差所表示的。
[0084] 上游子单元312、下游子单元318和FBA代谢324都用后续状态数据集334的初始条件求解。这些解产生新的分子浓度集、上游供应和下游需求(未示出),这又产生第二后续状态数据集334,其中该第二数据集反映了在第二后续状态344下生产网络内的新条件。
[0085] D.产生时间序列的迭代求解
[0086] 因此,在时间序列中的每个时间步,上游子单元312、下游子单元318和FBA代谢324使用在前一时间步的状态数据集中提供的初始条件来求解。FBA代谢324的目标函数用根据前一时间步的状态数据集计算的新目标值更新。然后,对上游子单元312、下游子单元318和FBA代谢324的解被用于更新前一时间步的状态数据集并产生新的状态数据集。然后,在下一次迭代中使用这个新的状态数据集。
[0087] 可以通过计算连续状态数据集之间的差并将该差除以这些状态数据集所表示的时间间隔来确定细胞的生长速率或生产网络的总生产速率(如由上游子单元312、下游子单元318和FBA代谢324所表示的)。例如,如图3所示的FBA时间序列300的生长速率可以从第一后续状态332和初始状态302之间的差除以时间间隔t1–t0来计算。附加地或替代地,细胞的生长速率可以通过计算目标函数和FBA代谢324的通量值解之间的差来确定。如前所述,FBA代谢324的生长速率受限目标函数表示细胞的总生物量,因此计算目标函数之间的差可以表示时间序列内的时间间隔内的总细胞生长的差。
[0088] 可以迭代地求解FBA时间序列300,直到后续时间步之间的生长速率差达到阈值。给定初始状态302处描述的初始条件,该阈值可以表示生产网络的稳态(homeostasis)。因此,随着生长速率之间的差变小,这可以指示生产网络已经达到稳定状态,FBA时间序列300可以结束。
[0089] 因此,通过在更大的生产网络中对FBA代谢324的迭代求解,可以调节FBA代谢324的输入和输出通量值,使得它们满足给定上游供应的下游需求。
[0090] V.细胞过程的结果(outcome)
[0091] 可以使用FBA时间序列300的迭代求解来确定细胞过程的结果。细胞过程的结果是细胞过程网络模型的任何数值解。每个子单元、子单元集以及包含所有子单元的全细胞模型可以各自具有相关联的结果。每个细胞过程可能有多个结果,其中每个结果有不同的度量单元。例如,第一结果可以是酸碱度(pH)的变化,而第二结果可以是产生的ATP分子的数量(例如,测量分子计数)。这些结果中的每一个都可以从细胞过程的网络模型的相同数值解中导出,因为数值解可以被转换成不同的度量单元。跨时间间隔计算细胞过程的结果,并因此表示细胞过程从第一时间的第一状态到后续时间的第二状态的变化。对于时间无关的模型(诸如FBA),可以在初始条件的初始状态和对模型的时间无关解之间计算细胞过程的结果。因此,“初始条件”被认为是第一状态,数值解被认为是第二状态,并且“时间间隔”跨越这两个状态。
[0092] 可以从任何单独的子单元的数值解或者从全细胞模型200内的子单元分组的组合数值解来测量细胞过程的每个结果。例如,细胞过程的结果可以通过计算来自对FBA代谢的数值解的结果来测量代谢。可以通过计算在不同时间步计算的解通量值之间的差(诸如FBA通量数据集324和从后续生长速率受限目标函数346计算的后续通量数据集之间的差)来测量FBA代谢324的结果。虽然可以跨每个子单元计算结果,但状态数据集聚集了跨所有子单元的结果。因此,状态数据集之间的差被用于确定全细胞模型200的结果。例如,全细胞模型200的结果可以通过计算初始状态数据集304和后续状态数据集334之间的差来确定。细胞过程的结果的示例在下面的图4-图6中描述。
[0093] VI.ATP浓度示例
[0094] 图4是实施改进的FBA系统的细胞内的ATP浓度的示例图。ATP的细胞浓度400是细胞过程结果的示例。如参考图1-3所示,ATP的细胞浓度400反映了FBA代谢内的ATP的浓度、上游子单元、下游子单元和ATP的缓冲物浓度。ATP的细胞浓度400可以通过计算状态数据集(诸如初始状态数据集304和后续状态数据集334)之间的差来确定。ATP的细胞浓度400的行为反映了生长速率受限目标函数所施加的对FBA代谢内的代谢生产的限制。
[0095] x轴反映了生产网络内的ATP分子的分子计数402。y轴给出以秒为单位的时间404。ATP的细胞浓度400反映了对FBA代谢的多个迭代时间步解,诸如参考图3在FBA时间序列300中描述的。
[0096] 在所示的示例中,新需求408被应用于生产网络。新需求可以来自一个或多个下游子单元(来自FBA代谢)。响应于新需求408,在耗尽410处,细胞内的ATP浓度被耗尽。在耗尽410期间,FBA代谢内的ATP的生产可能没有充分增加以满足下游需求,因此ATP的总浓度下降。在生产速率能够与下游需求相匹配之前,响应于下游需求,FBA代谢内的ATP的生产可能存在时间滞后。然而,该初始耗尽410反映了代谢的生物学限制,因此可以是细胞对新需求
408的响应的准确模拟。ATP的缓冲物浓度可以防止耗尽410导致生产网络内的ATP浓度为零或“负”。
[0097] 在图4中表示的时间序列中求解FBA代谢的连续迭代之后,FBA的生长速率受限目标函数被更新以反映新需求408的新下游需求,直到FBA生产达到生产响应412。在该时间步后,FBA代谢内的ATP的生产增加,细胞内ATP的浓度上升,以满足下游的需求。如校正414所示,响应于新需求408,FBA代谢的生产响应可能过度校正生产。然而,在对FBA代谢的连续迭代求解中,生产的峰值被降低,以反映ATP的浓度与下游需求相匹配的事实。在校正414处,降低了FBA代谢内的ATP的产生速率,以满足新需求408。然后,ATP的生产达到稳定状态416,此时细胞已经根据新需求408返回到稳态(homeostasis)。
[0098] 新需求408和生产响应412之间的时间滞后以及图4所示的曲线斜率可以由参考图3描述的固有速率参数328来定义。例如,比例参数(例如,补偿)可以确定新需求408和生产响应412之间的时间滞后的持续时间,而导数参数(例如,惯性)定义生产响应412和校正414之间的响应曲线的斜率,而积分参数(例如,半衰期)定义耗尽410速率。
[0099] ATP的细胞浓度400证明了改进的FBA代谢改变生产以满足下游需求的能力。
[0100] VII.大分子(macromolecule)浓度示例
[0101] 图5是实施改进的FBA系统的细胞内的多个分子浓度的示例图。示出了各种大分子的细胞浓度500,并反映了跨FBA的给定大分子浓度、上游子单元、下游子单元和缓冲物浓度。细胞浓度500是细胞过程的结果的示例,并且可以根据状态数据集之间的差来计算。如参考图1-3所示,细胞浓度500随时间的变化通过对改进的FBA系统的迭代求解来确定。x轴给出以秒为单位的时间504,而y轴给出以克(1e-13)为单位502的大分子浓度。
[0102] 干细胞重量506给出了改进的FBA系统中的总生物量。在纯FBA系统中,干细胞重量506与目标函数同义,然而在改进的FBA系统中,干细胞重量506反映FBA系统内的生物量、上游和下游子单元、以及缓冲物浓度。对干细胞重量506有贡献的单独的大分子如下所示,如蛋白质508、RNA 510和DNA 512。干细胞重量506曲线的导数可以用作细胞生长速率。干细胞重量506导数可与真实生命预期要求生长速率、主要文献或任何其他参考材料进行比较,以确定改进的FBA系统的准确性。大分子蛋白质508、RNA 510和/或DNA 512中的任何一个的导数可以类似地被确定为单独的大分子速率,并与真实生命预期速率、主要文献或任何其他参考材料进行比较,以确定改进的FBA系统的准确性。
[0103] VIII.氨基酸浓度示例
[0104] 图6是实施改进的FBA系统的细胞内氨基酸浓度的示例图。选择的氨基酸的细胞浓度600反映了跨FBA代谢的浓度、上游和下游子单元、以及缓冲物浓度,并且通过对改进的FBA系统的迭代求解而生成。选择的氨基酸的细胞浓度600是细胞过程的结果的示例,并且可以根据状态数据集之间的差来计算。x轴给出以秒为单位的时间604,而y轴给出分子计数(1e7)602。天冬氨酸606、丙氨酸608、亮氨酸610、缬氨酸612和脯氨酸614的浓度曲线都反映了由FBA代谢确定的调节的生产。可以将这些曲线的生长速率与真实生命生长预期、主要文献或任何其他参考资料进行比较,以确定改进的FBA系统的准确性。
[0105] IX.其他注意事项
[0106] 已经描述了许多实施例。然而,应当理解,在不脱离本发明的精神和范围的情况下,可以进行各种修改。
[0107] 应当理解,本公开的附图和描述已经被简化以示出与清楚理解本公开相关的元件,同时为了清楚起见,忽略了在典型系统中发现的许多其他元件。本领域普通技术人员可以认识到,在实现本公开时,其他元件和/或步骤是期望的和/或需要的。然而,因为这样的元件和步骤在本领域中是众所周知的,并且因为它们不便于更好地理解本公开,所以本文不提供对这样的元件和步骤的讨论。本文的公开针对本领域技术人员已知的对这些元件和方法的所有这些变化和修改。
[0108] 以上描述的一些部分根据算法和对信息的操作的符号表示来描述实施例。这些算法描述和表示通常被数据处理领域的技术人员用来将他们工作的实质有效地传达给本领域的其他技术人员。这些操作虽然在功能上、计算上或逻辑上进行了描述,但应理解为由计算机程序或等效电路、微码等来实现。
[0109] 本文描述的任何步骤、操作或过程可以用一个或多个硬件或软件模块单独或与其他设备结合来执行或实现。在一个实施例中,软件模块用计算机程序产品来实现,该计算机程序产品包括包含计算机程序代码的计算机可读非暂时性介质,该计算机程序代码可以由计算机处理器来执行,以执行所描述的步骤、操作或过程中的任何一个或所有。
[0110] 本发明的实施例还可以涉及通过本文描述的计算过程产生的产品。这种产品可以包括由计算过程产生的信息,其中该信息存储在非暂时性的、有形的计算机可读存储介质上,并且可以包括本文描述的计算机程序产品或其他数据组合的任何实施例。
[0111] 如本文所使用的,对“一个实施例”或“实施例”的任何引用意味着结合该实施例描述的特定元件、特征、结构或特性被包括在至少一个实施例中。在说明书的不同地方出现的短语“在一个实施例中”不一定都指同一个实施例。
[0112] 如本文所使用的,术语“包括”、“包含”、“具有”、“存在”或其任何其他变体旨在涵盖非排他性包含。例如,包括一系列元素的过程、方法、物品或装置不一定仅限于那些元素,而是可以包括未明确列出的或这种过程、方法、物品或装置固有的其他元素。此外,除非明确声明相反,“或”指的是包含性的或,而不是排他性的或。例如,条件A或B满足以下任一条件:A为真(或存在)、B为假(或不存在)、A为假(或不存在)、B为真(或存在)、A和B都为真(或存在)。
[0113] 此外,使用“一”或“一个”来描述本文的实施例的元件和组件。这仅仅是为了方便和给出本发明的一般意义。该描述应该被理解为包括一个或至少一个,单数也包括复数,除非显然它另有含义。
[0114] 虽然已经图示和描述了特定的实施例和应用,但是应当理解,所公开的实施例不限于本文公开的精确构造和部件。对于本领域技术人员来说明显的是,在不脱离所附权利要求限制的精神和范围的情况下,可以对本文公开的方法和设备的布置、操作和细节进行各种修改、改变和变化。