Projekt Humanoid beim Prix Ars Electronica 2025
| IT-HTL Medientechnik
Kernfunktion der Anwendung ist die kamerabasierte Erfassung von Handbewegungen. Sobald die Fingerspitzen zusammengeführt werden, aktiviert sich ein „primed“-Zustand – vergleichbar mit einem Mausklick. Mit beiden Händen lassen sich virtuelle Boxen im Raum erzeugen und verschieben, deren Inhalt anschließend per Sprachbefehl als Foto gespeichert werden kann. Ein integrierter sprachbasierter KI-Assistent reagiert auf einfache englische Kommandos wie „pin“, „fix“ oder „take a screenshot“ und bestätigt Aktionen akustisch.
Das Ziel des Projekts: eine intuitive, barrierefreie und kollaborative Software zu schaffen, die die Arbeit mit Bildern – beispielsweise in Meetings oder Gruppenarbeiten – deutlich vereinfacht. In weiterer Folge soll Humanoid die Basis für ein umfassendes 2D- und 3D-Bildbearbeitungs- und Modellierungssystem bilden, das vollständig durch Sprache und Gesten gesteuert wird.
Die Fachjury zeigte sich beeindruckt: „Das Projekt überzeugt durch seine innovative Verbindung von Hand-, Gesten- und Gesichtserkennung mit sprachgesteuerter Interaktion – alles umgesetzt in einer lokal laufenden Python-Anwendung.“ Besonders hervorgehoben wurde der Fokus auf Barrierefreiheit: Humanoid zeigt, wie Technologie Menschen mit Einschränkungen den Zugang zu digitalen Inhalten erleichtern kann.
Trotz des frühen Entwicklungsstadiums überzeugt das Projekt durch technisches Know-how, gesellschaftliche Relevanz und viel Potenzial für zukünftige Anwendungen. Die eingesetzten Technologien wie MediaPipe, OpenCV und die sprachbasierte KI-Interaktion machen Humanoid zu einem bemerkenswerten Beitrag zur digitalen Zukunft der Bildbearbeitung.