Pably, P. (2023). Experimental characterisation and simulation of the product formation dynamics of an induced Escherichia coli cultivation [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.104302
In the biotech industry, the optimization and the control of fermentation processes are essential in order to repeatedly meet quality standards and to increase competitiveness. Process models are the key to success as they provide a great summary of the available knowledge and many areas in engineering capitalize on them, from process development to monitoring and advanced control strategies. Traditional approaches utilize empirical models by including technical process parameters as the describing variables, but a shift towards mechanistic equations and physiological descriptors comes with several advantages. The cell itself as the catalytic entity in bioprocesses becomes the focal point and is thereby considered more thoroughly throughout up-scaling or process transfer efforts.The goal of this master thesis was to explore the influence of such physiological variables on the product formation dynamics of an Escherichia coli process and mould the findings into a novel mechanistic model. The investigated organism expresses the recombinant enzyme L-Lactatedehydrogenase upon induction and is prone to product aggregation into biochemically inactive inclusion bodies (IBs). The ambition was to comprehensively describe the protein formation, while also considering the viability of the biomass. As a starting point, a previously established state-space model for growth and death of the organism was extended with equations for total product and IB formation. Several experiments were conducted to obtain data, which was used to find suiting kinetic expressions and estimate the model parameters. Following the guidelines for Good Modeling Practices (GMoP), the resulting structures were analysed for their structural and practical identifiability. The final model described the total productivity through a Monod term driven by the specific substrate uptake rate and was combined with a Haldane inhibition term that used the specific metabolised substrate as an indicator for the cell age. The protein localisation in form of the specific IB formation was expressed through a Moser kinetic utilizing the specific total productivity. Although characterized as overall ill-conditioned, the resulting model was identifiable and tracked the production dynamics with high accuracy, achieving NRMSE values of 0.094 for the overall product amount and 0.153 for IBs. It does so by implementing a mechanistic model describing both, the total product formation as well as the accumulation into IBs using physiological descriptors only and considers the influence of the cell viability explicitly. To the knowledge of the author, this holistic approach and the achieved results pose as a novelty within the described field of application. Furthermore, the developed model identified the specific substrate uptake rate as an influential factor on the efficiency of the product formation and the tendency to form IBs. In a simulation study this was used to optimize the production process for a variety of objective functions. Through numerical determination of the optimal substrate uptake rate trajectory, the product titer was maximized in-silico and the share of IBs was found to be adjustable within 9-29%. After implementing according economical functions the space-time yield could be improved by 17% and the substrate-to-product yield by 50%, compared to the maximum titer case.Apart from the resulting opportunities in process optimization and development, this model holds potential to be utilized as a soft-sensor for the productivity and further in advanced control strategies like Model Predictive Control (MPC). Simple online-measurements are sufficient for these implementations and their capabilities serve as a strong motivator for industrial applications. Finally, they enable knowledge based process monitoring and quality control, which falls in line with recent initiatives of regulatory bodies pushing for more Quality by Design (QbD) and advanced Process Analytical Technologies (PAT).
en
Die Optimierung und Kontrolle von biotechnologischen Prozessen sind zentrale Aspekte für industrielle Anwendungen um dauerhaft Qualitätsstandards einhalten zu können und konkurrenzfähig zu bleiben. Der Schlüssel zum Erfolg sind dabei Prozessmodelle, da sie eine hervorragende Sammlung des vorhandenen Wissens darstellen und viele Vorteile für Prozessentwicklung, -überwachung und -regelung bieten. Traditionelle Ansätze setzen dabei auf empirische Modelle und beschreiben den Einfluss von technischen Prozessparametern. Die Verwendung mechanistischer Gleichungen und physiologischer Prozessvariablen birgt jedoch großes Potential. Dabei rückt die Zelle als zentrale katalytische Einheit des Bioprozesses in den Fokus des Modells und wird bei Scale-up und Prozesstransfer umfassender berücksichtigt. Das Ziel dieser Diplomarbeit war die Untersuchung des Einflusses von physiologischen Variablen auf die Produktbildungsdynamik eines Escherichia coli Prozesses und die Entwicklung eines mechanistischen Modells aus den gewonnenen Erkenntnissen.Der untersuchte Organismus produziert das rekombinante Enzym L-Laktatedehydrogenase nach Induzierung und ist anfällig für Bildung von biochemisch inaktiven Einschlusskörpern (IBs). Zur Identifizierung dieser Proteinbildungsdynamik und des Einflusses auf die Aggregation zu IBs wurden mehrere Experimente mit variierenden Substratfütterungsraten durchgeführt. Als Ausgangspunkt für die Modellbildung wurden die Ergebnisse zusammen mit einem bereits vorhandenen Zustandsraummodell für Zellwachstum und -sterben verwendet. Dabei wurden verschiedene kinetische Gleichungen getestet, um sowohl die gesamte Proteinproduktion als auch die IB-Bildung zu beschreiben. Den Empfehlungen der Good Modeling Practices (GMoP) folgenden wurde zur Auswahl der geeigneten Gleichungen sowohl die Fähigkeit die Messdaten zu replizieren, also auch die strukturelle und praktische Identifizierbarkeit der resultierenden Modellstruktur beurteilt. Das finale Modell beschreibt die spezifische Gesamtproduktivität in dem es die spezifische Substrataufnahmerate als treibende Variable und die spezifische metabolisierte Substratmenge inhibierend als Indikator für das Zellalter enthält. Der Anteil des Produkts, welcher zu IBs aggregiert wird über eine separate spezifische Rate beschrieben, welche die spezifische Gesamtproduktivität als Variable einer Moserkinetik einsetzt. Die entwickelte Modellstruktur wurde insgesamt als schwach konditioniert, aber identifizierbar eingestuft und beschrieb die Messdaten mit hoher Genauigkeit. Dabei wurden NRMSE-Werte von 0.094 für die gesamte Proteinmenge und 0.153 für die IB-Menge erzielt. Das entwickelte mechanistische Modell verwendet nur physiologische Variablen und berücksichtigt die Viabilität der Zellmasse explizit. Es beschreibt dabei sowohl die Bildung der gesamten Proteinmenge als auch die Unterscheidung in lösliches und aggregiertes Produkt. Dem Wissen des Autors zur Folge stellt dieser holistische Ansatz und die dabei erzielten Resultate eine Neuheit auf diesem Anwendungsgebiet dar.Das entwickelte Modell zeigte, dass die spezifische Substrataufnahmerate einen wesentlichen Einfluss auf die Effizienz und die Aggregationsneigung der Proteinbildung darstellt. Innerhalb einer Simulationsstudie wurde daraufhin der Produktionsprozess durch numerische Ermittlung entsprechender Trajektorien für die Substrataufnahmerate in-silico optimiert. Über die Wahl geeigneter Zielfunktionen konnte der Produkttiter maximiert und der IB-Anteil des Produkts innerhalb von 9 bis 29 % variiert werden. Durch das Einführen von ökonomischen Kennzahlen als Optimierungsziele konnte außerdem die Raum-Zeit-Ausbeute um 17 % und die Substrat-Produkt-Ausbeute um 50 % verbessert werden, verglichen mit der Prozessführung für maximalen Produkttiter.Die Ergebnisse zeigen das Potential des Modells für Prozessoptimierung und -entwicklung, aber auch die Möglichkeit für den Einsatz als Softsensor für die Produktivität. Die Implementierung verwendet einfache, bereits vorhandene Online-Messungen und kann in weiterer Folge für fortgeschrittene Regelungsstrategien verwendet werden, wie Model Predictive Control (MPC). Diese Anwendungsgebiete zusammen mit den Möglichkeiten für wissensbasierte Prozessüberwachung und Qualitätskontrolle dienen als starker Motivator für industrielle Umsetzungen. Der Einsatz solcher mechanistischer Modelle wird dabei auch durch die neuen Initiativen der zuständigen Aufsichtsbehörden bezüglich Quality by Design (QbD) und modernen prozessanalytischen Technologien (PAT) für Bioprozesse unterstützt.
de
Additional information:
Zusammenfassung in deutscher Sprache Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers