Nach den gravierenden Einschnitten, die die COVID-19 Pandemie für den Einzelhandel mit sich brachte, dürfen die Geschäfte unter strengen Hygienemaßnahmen wieder öffnen. Ein entscheidender Faktor um die Pandemie einzudämmen ist der ausreichende Abstand zwischen den Kunden. In vielen Bundesländern versucht man das durch die maximal zulässige Gesamtzahl der Personen auf der Geschäftsfläche zu gewährleisten. Dazu wird von Seiten des Einzelhandels eine maximale Besucherzahl eingeführt, um den Hygienerichtlinien gerecht zu werden. Viele Einzelhändler stellen dafür zusätzliches Personal ab um die Kunden beim Betreten sowie Verlassen des Geschäftes zu zählen, was zusätzliche Kosten verursacht. Aktuelle Entwicklungen im Bereich der künstlichen Intelligenz (KI) und vor allem der Bilderkennung führten zu der Idee, die Kundenzählung mit Hilfe von KI-Algorithmen zu automatisieren. Eine essentielle Herausforderung an die Anwendung von Seiten des beteiligten Projektpartners ist die lokale Ausführung sowie eine live Bearbeitung des Datenstreams. Somit soll sichergestellt werden, dass keine Daten lokale oder online gespeichert werden um den Datenschutz-bedenken der Kunden entgegen zu wirken. Deshalb viel die Entscheidung eine Echtzeitanalyse eines Videostreams durchzuführen und die Berechnungen auf lokal auf einem Mini-Computer durchzuführen. Um die Kosten für die Einzelhändler im Rahmen zu halten, entschieden wir uns für einen Mini Computer Raspberry Pi 4 für ca. 60€ mit geeignetem Zubehör und eine USB Kamera von Logitech für ca. 40€:
Dieser Computer im Taschenformat ist unglaublich energieeffizient (5-10 W Stromverbrauch), bietet aber ausreichend Rechenleistung um rechenoptimierte KI-Modelle auszuführen. Die Kamera sowie der Rasperry Pi können im Eingangsbereich montiert werden. Um Kunden anhand eines Videolivestreams zu zählen, falls sie bestimmte Bedingungen erfüllen, nutzen wir Computer Vision und Deep Learning Algorithmen speziell für mobile Endgeräte. Mit Hilfe verschiedener Frameworks wie OpenCV und vortrainierten künstlichen neuronalen Netzen (mobileNetSSD) wird sowohl die Objekterkennung (was ist der Kunde) wie auch Objektverfolgung (wohin läuft der Kunde) realisiert. Überschreitet der Kunde eine imaginäre Linie im Videostream, hat er den Laden betreten oder verlassen. Der Algorithmus ist dabei richtungssensitiv und es kann dadurch gezählt werden wie viele Kunden sich aktuell im Laden befinden. Das folgende Video zeigt eine Demonstration des Setups sowie des Algorithmus anhand eines Beispielvideos:
Des Weiteren wurde die Applikation in einem kleinen Lebensmitteleinzelhandel an einem Samstag getestet. Am Ende des Geschäftstages befanden sich laut dem Counter noch 25 Personen im Laden. Diese Differenz mach die entwickelte Lösung für den Einzelhandel nicht anwendbar. Auf eine absolute Kundenzahl von 403 Leuten, erreicht die Lösung statistisch gesehen jedoch eine geringe Fehlerquote. Der Grund dafür ist, dass der Raspberry Pi über eine zu geringe Rechenleistung für Deep Learning Anwendungen verfügt und deshalb zu wenige Bilder pro Sekunde verarbeiten kann. Neue Edge AI-Geräte, wie der Jetson Nano von Nvidia versprechen eine höhere Rechenleistung durch eine eingebaute GPU. In den kommenden Projektschritten wird versucht die Anwendung durch leistungsstärkere Hardware zu verbessern .