Brincoveanu, C. (2019). Analysis of time series data and optimization of coffee roasting processes using machine learning techniques [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.52361
E194 - Institut für Information Systems Engineering
-
Date (published):
2019
-
Number of Pages:
81
-
Keywords:
Specialty coffee /
de
Specialty coffee,
en
Abstract:
Specialty coffee ist eine wachsende Industrie und es gibt eine Vielzahl von Innovationen für Kaffeeröst-Software. In dieser Arbeit wurden Machine Learning Techniken auf einem großen Datensatz an Kaffeeröstprozessen angwandt. Die Arbeit fokussiert auf sechs Fragestellungen, mit dem Ziel verschiedene Methoden zu evaluieren die es den Anwendern erleichtern sollen konsistent zu rösten. 1. Als erstes wurde eine Klassifikation anhand der Geschmacksbeschreibung trainiert. Die Einteilung erfolgte anhand des Flavour Wheels in neun unbalancierte Klassen. Die Klassifikation hat vor allem für die vier häufigsten Klassen mit hoher Genauigkeit funktioniert (micro-average F1-score: 0.53). 2. Ein weiterer Punkt war die Vorhersage der Röstkurven, welche in Vektoren transformiert wurden deren Elemente die Dauer in bestimmten Temperaturintervallen repräsentieren. Die Modelle wurden in etwa zweiminütigen Batches evaluiert. Hier zeigte Ridge über alle Batches konsistent einen weitaus geringeren MSE im Vergleich zu den Referenzkurven. Auch über die gesamte Röstung evaluiert übertraf Ridge (MSE: 1.562) die Referenzkurven (MSE: 4.934). 3. Eines der behandelten Themen war die Vorhersage der Kaffeequalität. Dies wurde zuerst als Regression modelliert. Keiner der getesteten Regressoren konnte die Baseline übertreffen. 4. Das Eingreifen durch den Benutzer war ein weiteres Thema. Dieser kann während des Prozesses durch Änderung des Gas-Inputs den Verlauf der Temperaturkurve beeinflussen. Die Vorhersage dieses Eingreifens wies mittels eines LGBMRegressors eine fünffache Reduktion des Mean Squared Errors im Vergleich zur Baseline auf. 5. Ein weiterer Ansatz war als Visualisierungstool eine Self Organizing Map welche auf dem Zustandsraum der Röstungen trainiert wurde. 6. Schließlich wurde genauer untersucht wie erkannt werden kann ob eine Maschine vorgeheizt wurde. Als Baseline wurde angenommen, dass die ersten drei Röstungen eines Tages auf einer kalten Maschine durchgeführt wurden, während die Maschine danach aufgeheizt ist. Diese Baseline wurde verwendet um Zusammenhänge zwischen dem Zustand der Maschine und weiteren Attributen zu finden.
de
Specialty coffee is a growing industry and there has been an explosion in innovation of coffee roasting software. In this work, machine learning techniques were employed on a large dataset of coffee roast processes. This work focuses on six questions, with the goal of evaluating different methods which shall facilate consistent roasting for the users. 1. First, a classification was trained on sensorial descriptors. The division into nine unbalanced classes was done according to the Flavour Wheel. The classification had a high accuracy especially for the four most frequently occurring classes (micro-average F1-score: 0.53). 2. Another task was predicting roast temperature curves, which were transformed into vectors representing durations in certain temperature intervals. The models were evaluated over batches with a duration of approximately two minutes. Here, Ridge yielded a lower MSE than the reference curves consistently over all batches. Also in evaluation over full roasts, Ridge (MSE: 1.562) outperformed the reference curves (MSE: 4.934). 3. One of the topics looked into was prediction of coffee quality. This was first modeled as a regression. None of the tested regressors could outperform the baseline. 4. User interaction was another topic. The user can influence the course of the temperature curve during the process by changing the gas input. The prediction of this interaction using an LGBMRegressor yielded a fivefold reduction of Mean Squared Error compared to the baseline. 5. Another approach was a visualization tool, a Self Organizing Map, which was trained on the roast state space. 6. Finally, more depth was put into detection whether a machine was pre-heated. As a baseline, it was assumed that the first three roasts of a given day were performed on a cold machine, whereas afterwards the machine heated up. This baseline was used to find relations between the state of the machine and further attributes.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers