Masterthesis: Objekterkennung mit Hilfe von Convolutional Neural Networks am Beispiel ägyptischer Hieroglyphen
in Publications :: #thesisde | en
Im Rahmen dieser Arbeit wurden unterschiedliche Architekturen von Convolutional Neural Networks (CNN) auf ihre Eignung für die Objekterkennung am Beispiel von ägyptischen Hieroglyphen untersucht.
Zunächst werden Grundlagen zu künstlichen neuronalen Netzen und den Bestandteilen von CNNs, wie Convolutional-Layer, eingeführt und erklärt, dann folgen Erläuterungen zu den verwendeten Datensätzen und die damit verbundenen Schwierigkeiten. Es werden anschließend Bibliotheken für konkrete Implementierung und Verwendung von künstlichen neuronalen Netzen vorgestellt und der Ablauf der Evaluation der Objekterkennung beschrieben.
Die CNNs wurden mit unterschiedlichen Anzahlen an Klassen und der damit verbundenen Anzahl an Bildern trainiert und evaluiert. Die Experimente wurden anhand der drei benutzen Trainingsmethoden unterteilt. Bei der ersten Methode wurden die CNNs mit Hilfe von Autoencodern vortrainiert. Bei der Zweiten wurden die CNNs blockweise trainiert und bei der dritten Methode wurden tiefere Netzarchitekturen untersucht. Es wurden dabei unterschiedliche, in der Literatur beschriebene, Netzarchitekturen wie Residual Networks (ResNet) und Densely Connected Convolutional Networks nach implementiert und evaluiert.
Die Ergebnisse der durchgeführten Experimente zeigen zunächst, dass es möglich ist, CNNs mit bis zu 69 Convolutional-Layer zu trainieren, etwa 6500 unterschiedliche ägyptische Hieroglyphen zu klassifizieren und schlussendlich eine Objekterkennung mit sehr guten Ergebnissen durchzuführen. Die besten Ergebnisse für die Objekterkennung 0, 92362 wurden dabei für ein CNN mit 6465 Klassen und 13 Convolutional-Layer erreicht.