Title: Analysis of time series data and optimization of coffee roasting processes using machine learning techniques
Other Titles: Analyse von Röstkurven-Zeitreihen zur Optimierung von Röstprozessen mittels Machine Learning
Language: English
Authors: Brincoveanu, Constantin 
Qualification level: Diploma
Advisor: Rauber, Andreas 
Issue Date: 2019
Number of Pages: 81
Qualification level: Diploma
Abstract: 
Specialty coffee ist eine wachsende Industrie und es gibt eine Vielzahl von Innovationen für Kaffeeröst-Software. In dieser Arbeit wurden Machine Learning Techniken auf einem großen Datensatz an Kaffeeröstprozessen angwandt. Die Arbeit fokussiert auf sechs Fragestellungen, mit dem Ziel verschiedene Methoden zu evaluieren die es den Anwendern erleichtern sollen konsistent zu rösten. 1. Als erstes wurde eine Klassifikation anhand der Geschmacksbeschreibung trainiert. Die Einteilung erfolgte anhand des Flavour Wheels in neun unbalancierte Klassen. Die Klassifikation hat vor allem für die vier häufigsten Klassen mit hoher Genauigkeit funktioniert (micro-average F1-score: 0.53). 2. Ein weiterer Punkt war die Vorhersage der Röstkurven, welche in Vektoren transformiert wurden deren Elemente die Dauer in bestimmten Temperaturintervallen repräsentieren. Die Modelle wurden in etwa zweiminütigen Batches evaluiert. Hier zeigte Ridge über alle Batches konsistent einen weitaus geringeren MSE im Vergleich zu den Referenzkurven. Auch über die gesamte Röstung evaluiert übertraf Ridge (MSE: 1.562) die Referenzkurven (MSE: 4.934). 3. Eines der behandelten Themen war die Vorhersage der Kaffeequalität. Dies wurde zuerst als Regression modelliert. Keiner der getesteten Regressoren konnte die Baseline übertreffen. 4. Das Eingreifen durch den Benutzer war ein weiteres Thema. Dieser kann während des Prozesses durch Änderung des Gas-Inputs den Verlauf der Temperaturkurve beeinflussen. Die Vorhersage dieses Eingreifens wies mittels eines LGBMRegressors eine fünffache Reduktion des Mean Squared Errors im Vergleich zur Baseline auf. 5. Ein weiterer Ansatz war als Visualisierungstool eine Self Organizing Map welche auf dem Zustandsraum der Röstungen trainiert wurde. 6. Schließlich wurde genauer untersucht wie erkannt werden kann ob eine Maschine vorgeheizt wurde. Als Baseline wurde angenommen, dass die ersten drei Röstungen eines Tages auf einer kalten Maschine durchgeführt wurden, während die Maschine danach aufgeheizt ist. Diese Baseline wurde verwendet um Zusammenhänge zwischen dem Zustand der Maschine und weiteren Attributen zu finden.

Specialty coffee is a growing industry and there has been an explosion in innovation of coffee roasting software. In this work, machine learning techniques were employed on a large dataset of coffee roast processes. This work focuses on six questions, with the goal of evaluating different methods which shall facilate consistent roasting for the users. 1. First, a classification was trained on sensorial descriptors. The division into nine unbalanced classes was done according to the Flavour Wheel. The classification had a high accuracy especially for the four most frequently occurring classes (micro-average F1-score: 0.53). 2. Another task was predicting roast temperature curves, which were transformed into vectors representing durations in certain temperature intervals. The models were evaluated over batches with a duration of approximately two minutes. Here, Ridge yielded a lower MSE than the reference curves consistently over all batches. Also in evaluation over full roasts, Ridge (MSE: 1.562) outperformed the reference curves (MSE: 4.934). 3. One of the topics looked into was prediction of coffee quality. This was first modeled as a regression. None of the tested regressors could outperform the baseline. 4. User interaction was another topic. The user can influence the course of the temperature curve during the process by changing the gas input. The prediction of this interaction using an LGBMRegressor yielded a fivefold reduction of Mean Squared Error compared to the baseline. 5. Another approach was a visualization tool, a Self Organizing Map, which was trained on the roast state space. 6. Finally, more depth was put into detection whether a machine was pre-heated. As a baseline, it was assumed that the first three roasts of a given day were performed on a cold machine, whereas afterwards the machine heated up. This baseline was used to find relations between the state of the machine and further attributes.
Keywords: Specialty coffee /
Specialty coffee,
URI: https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-125088
http://hdl.handle.net/20.500.12708/13793
Library ID: AC15381143
Organisation: E194 - Institut für Information Systems Engineering 
Publication Type: Thesis
Hochschulschrift
Appears in Collections:Thesis

Files in this item:

Show full item record

Page view(s)

30
checked on May 15, 2021

Download(s)

82
checked on May 15, 2021

Google ScholarTM

Check


Items in reposiTUm are protected by copyright, with all rights reserved, unless otherwise indicated.