Evaluation unterschiedlicher Spracherkennungssysteme in der Domäne Humanoide Robotik
- Type:Bachelorarbeit
- Date:06.11.2015
- Supervisor:
Dipl.-Inform. Sebastian Weigelt
- Person in Charge:Dinesh Paskaran
- Links:Link zu GitLab
-
Die Entwicklung von humanoiden Robotern ist eins der meistbeachteten Forschungsgebiete der Informatik. Moderne Vertreter, wie der am KIT entwickelte ARMAR-III, sind heute in der Lage als Haushaltshelfer zu fungieren. Über ein Dialogsystem können dem Roboter ihm bekannte Aufgaben gestellt werden. Selbst für Laien stellt dies keine Herausforderung dar. Soll der Roboter jedoch neue, komplexe Techniken erlernen, muss dies von einem Spezialisten implementiert werden. Um Roboter alltagstauglich zu machen wäre es jedoch wünschenswert,
wenn der Nutzer dem Roboter neue Anweisungsfolgen beibringen bzw. einprogrammieren könnte. Aus diesem Grund entwickelt das IPD Tichy in Zusammenarbeit mit dem Institut für Anthropomatik ein System zur Programmierung von humanoiden Robotern mittels natürlicher Sprache.Die Architektur des Gesamtprojekts sieht die Nutzung eines Standard-Spracherkennungssystems vor. Um weiterführende Schritte durchführen zu können, werden möglichst fehlerfreie Spracherkenner-Ausgaben benötigt. Ziel der Bachelorarbeit ist es, das für das Projekt am besten geeignete Spracherkennungssystem auszuwählen. Hierzu sollen unterschiedliche Systeme anhand des projekteigenen Sprachkorpus mit üblichen Metriken, wie Wort- und Satzfehlerrate, vermessen werden. Darüber hinaus sollen auch Randbedingungen, wie Antwortzeit oder Notwendigkeit einer Trainingsphase, betrachtet werden. Zusätzlich soll untersucht werden, ob die Randbedingungen bei der Aufnahme des Audiosignals einen Einfluss auf die Qualität der Spracherkenner-Ausgabe haben. Hierzu soll der bereits vorhandene Fragebogen mit Szenario-Beschreibungen digitalisiert und über das Internet zugänglich gemacht werden.