Young Guns

TDWI Award Gewinner 2019

Hier stellen die Gewinner ihre Arbeiten vor

1. Platz
Miro Schleicher, Universität Magdeburg

Modelling and predicting early dropouts in a crowdsensing app
(Masterarbeit)

Today most people in the western world own smart mobile devices. This circumstance opens up opportunities for research to expand its traditional tools. An emerging trend is mobile crowd sensing, since a large group of people use the capability of their devices (e.g. sensors) to collect and share data. This data creates enormous data sets of information. Even in the medical field, this technique is increasingly used. An example of this is the TrackYourTinnitus (TYT) app, where tinnitus patients can monitor their disease and simultaneously the data is made available for research. Tinnitus is the phantom perception of sound and a neuropsychiatric disorder. Participation helps both participants to cope with their tinnitus and researchers by providing valuable data which is elsewise difficult to capture in clinical trials due to the particular characteristics (e.g. high variability) of the disease. Though, some people stop the usage of the app at a particular moment in time. Others pause for a while and further ones stop forever. A few stop using it after a very short time. The intended behavior is that the app is used every day. It therefore raises the question of whether it is possible to model and predict the early dropouts.

This thesis presents a method to model and predict early dropouts in a crowd sensing app. For this purpose, an option is offered to define early dropouts and apply this definition to a data set. Subsequently, various methods of classification and clustering are presented to make the corresponding predictions. It is revealed that the definition of early for the TYT data set is 10 days. According to the definition each participant is labeled with one of four classes, whereas two encompass dropouts the other two include non-dropouts. In order to predict early dropouts static data (e.g. personal data or the tinnitus assessments catalog Mini-TQ) assessed prior to the usage of the app is not predictive. The Algorithm Rotation Forrest, Random Forrest, C45 and Shapelet transform learn on time series with a maximum length of 10 days achiev a mean accuracy of ≥75% in predicting the classes. It also shows that the clustering algorithm “Agglomerative Hierarchical Clustering” can produce clustering results with a silhouette coefficient of 0.7964. The linkage method Ward’s method is used. The algorithm is applied to a distance matrix created from the univariate time series of users for the assessment question about the tinnitus consciousness. The distance matrix was created with dynamic time warping, which turns out to be a better distance measure than the Fréchet distance for this data set. At last, it is possible to model early dropouts and predict them by using the information of the first 10 days of assessment.

Bei Fragen können Sie Miro Schleicher direkt bei LinkedIn kontaktieren.

 

2. Platz
Thea Gasser, Berner Fachhochschule Wirtschaft

Bias – A lurking danger that can convert algorithmic systems into discriminatory entities: A framework for bias identification and mitigation
(Bachelorarbeit)

This thesis examines the existence of bias in algorithmic systems and presents them as the cause for unfair and discriminatory decisions that are made through the use of such systems. Extensive literature research was conducted to review current discussions on this issue. Content and thematic analysis was applied to over 100 journal articles, books and websites to bring together proposals on how bias can be identified and reduced. The results of the analysis were further developed to provide precise measures for project teams building Artificial Intelligence systems.

The findings demonstrate that humankind aims to map Human Intelligence to Artificial Intelligence, but no system has reached such intelligence yet due to the lack of machine sentience and self-awareness. Therefore, the human being maintains considerable influence on the design of the system. Cognitive bias is very likely to be reflected in algorithmic systems. Awareness of the topic of bias must increasingly be addressed in project teams and appropriate measures must be applied. It will also be illustrated that standardization work is in progress and that the areas of AI-responsibility, AI-safety and AI-fairness will have high priority in the future. The importance of the topic of bias in algorithmic systems has been recognized by researchers and managers and the demand for fair AI-systems is high. The outcome of this thesis is a framework that contributes to AI-safety. This framework could be considered as a guideline and proposes measures for identifying and mitigating bias in algorithmic systems. It can be adapted and extended to the specific project context. Future collaborations and regulations among business, institutions and society are required to successfully address this issue.

Bei Fragen können Sie Thea Gasser direkt bei LinkedIn kontaktieren.

 

3. Platz
Tom Fels, TU Dresden

Heuristische Modellempfehlung zur Prognose von Energiezeitreihen mit externen Einflüssen
(Masterarbeit)

Die Vorhersage künftiger Entwicklungen hat in vielen Bereichen eine große Bedeutung. Insbesondere in der Energiewirtschaft ist eine Nutzung mehrheitlich erneuerbarer Energien ohne präzise Prognosen derer Energieerzeugung nicht umsetzbar. Zur Aufrechterhaltung der Netzstabilität ist ein ausgeglichenes Verhältnis von Einspeisung und Entnahme von Energie aus dem Stromnetz erforderlich. Dies macht eine Regulierung notwendig. Die Menge eingespeister Energie hängt bei erneuerbaren Energiequellen stark von Umweltfaktoren ab. Auch der Verbrauch ist nicht konstant, sondern schwankt in Abhängigkeit äußerer Einflussfaktoren. Dies erfordert ein möglichst genaues Abschätzen des künftigen Systemverhaltens zur Sicherstellung der Stromversorgung. Die Prognosequalität hängt dabei stark von der Wahl des Modells, der Parametrisierung desselben und der Wahl der Einflussfaktoren ab. Ziel dieser Arbeit ist es daher, das Empfehlungssystem Heuristische Modellselektion (HMS) für Energiezeitreihen unter Berücksichtigung externer Einflüsse und verschiedener Modellbildungsverfahren mit diversen Parametrierungen zu entwickeln, implementieren und evaluieren.

Die Methoden dieser Arbeit werden auf real gemessenen Zeitreihen (äquidistante Messwertfolgen) aus der Energiewirtschaft und einigen simulierten US-Windeinspeisungszeitreihen angewandt. Es werden Modelle auf den gewählten exogenen Einflüssen berechnet und deren Ergebnisse gespeichert. Exogene Einflüsse umfassen dabei berechnete sowie gemessene Wetterzeitreihen und Clearsky-Modelle. Zu jeder der im Training verwandten Zeitreihen werden statistische Parameter, im folgenden als Features bezeichnet, berechnet. Diese repräsentieren die Zeitreihe in kompakter Form. Features umfassen beispielsweise Trend, Saison, Periodizität, Autokorrelation, Schiefe, Wölbung, Nichtlinearität, Selbstähnlichkeit und Chaos. Diese Eigenschaften werden genutzt, um die Ähnlichkeit neuer Zeitreihen zu den bereits Trainierten zu bestimmen und eine Klassifikation zu ermöglichen. Darüber hinaus wird auf der Basis von Features eine hochperformante Einflussauswahl implementiert. Anschließend kann das Bildungsverfahren und die genutzten Einflüsse des besten Vorhersagemodells der ähnlichsten Zeitreihe auch für die neue Zeitreihe verwandt werden. Beschriebenes Vorgehen bildet den Kern von HMS. Dieses wird auf hochdimensionalen Daten evaluiert und zeigt die besondere Eignung der featurebasierten Zeitreihenrepräsentation für Auswahlverfahren. Es werden zudem einige unterstützende Algorithmen entwickelt und implementiert, die auf Basis automatisch berechneter Features eine Klassifikation, Dimensionsreduktion und Einflussauswahl sowie die Berechnung der Distanzen zwischen Zeitreihen vornehmen.

Das entwickelte und implementierte Lernverfahren zur Modellauswahl ist dabei nicht auf die evaluierten Bereiche beschränkt. HMS ist für eine Vielzahl von Anwendungsfällen denkbar. In einigen Domänen übersteigt die Menge an Wissen, die Verfügbarkeit von Experten oder die Frequenz der Änderungen von Bedingungen die Grenzen, um Empfehlungen durch Menschen zu realisieren. Die in dieser Arbeit präsentierte Methode HMS bietet eine Möglichkeit der performanten und präzisen Auswahl der geeignetsten Modellbildungsverfahren, derer Parametrierung und externer Einflussfaktoren. Nach Vorstellung der grundlegenden Vorhersagemethoden und Algorithmen zur Einflussauswahl wird auf die Methodik der featurebasierten Einflussauswahl eingegangen. Ebenso wird die vorgestellte Methode gegen naive Verfahren evaluiert. Es zeigt sich, dass durch HMS zumeist eine Steigerung der Prognosequalität bei reduziertem Zeitaufwand erzielt werden kann.

Zur Abschätzung, ob die neu entwickelte Methode HMS naiven Ansätzen überlegen ist, wird eine Metrik entwickelt, welche die Zeitreihenanzahl und Homogenität der betrachteten Klasse nutzt. Auf deren Basis ist eine Schätzung der HMS-Empfehlungsgüte möglich.

Bei Fragen können Sie Tom Fels direkt bei LinkedIn kontaktieren.