LANZ.AI: Hochwertige Trainingsdaten für Machine Learning

Maschinelles Lernen und künstliche Intelligenzen gewinnen in der heutigen Zeit zunehmend an Bedeutung. Kein Wunder also, dass auch der Bedarf an Trainingsdaten wächst. Sie werden benötigt, um künstliche Intelligenzen mit dem nötigen Vorwissen zu ‚füttern‘ und maschinelles Lernen zu ermöglichen. Mithilfe von LANZ.AI können Unternehmen diese Erstellung von Trainingsdaten auslagern – und sich somit auf ihre eigentliche Arbeit rund um künstliche Intelligenzen konzentrieren. Im Gespräch mit 5-HT erzählt Daniel Lanz von einem Bereich der künstlichen Intelligenzen, der bisher kaum Beachtung gefunden hat – und dem sich sein Startup nun angenommen hat.

Gründer Daniel Lanz

LANZ.AI ist: Enabler und Accelerator

„LANZ.AI arbeitet mit dem impact sourcing Unternehmen Digital Divide Data (DDD), das über 500 Mitarbeiter für die Eingabe von Trainingsdaten beschäftigt, auf die wir sehr schnell zugreifen können“, erklärt Daniel Lanz, Geschäftsführer und Gründer des Startups LANZ.AI, „Unsere Kunden stellen die Rohdaten bereit. Das können beispielsweise 100.000 Kamerabilder aus dem Bereich der Qualitätskontrolle sein. Außerdem geben uns die Kunden eine exakte Beschreibung, wie das Produkt aussehen soll und woran Fehler auf den Bildern erkannt werden können. Daraus erstellen wir die Spezifikation für das so genannte Tagging oder Labeling der Bilder und besprechen mit unseren Kunden sehr detailliert, ob wir alles berücksichtigt haben. Das ist die wichtigste Phase, denn jetzt geht es um die Qualität. Das Prozedere wird dann in einer Pilotphase angewendet und die Ergebnisse werden überprüft, damit wir sicher sind, dass der Kunde die Daten erhält, die er wirklich benötigt. Auf diese gründliche Vorbereitung entfällt oft ein Drittel der gesamten Projektlaufzeit. Wenn alles klar ist, annotieren wir die Bilder. Beispielsweise kontrollieren wir, ob auf den Kamerabildern der Produkte Fehler zu sehen sind, und markieren diese auf den Bildern. LANZ.AI identifiziert und markiert also Objekte und Muster in Bilddaten, um qualitativ hochwertige Trainingsdaten für maschinelles Lernen zu erstellen.

Drone tagging: Kennzeichnen von Obstbäumen in Bildern, die von Drohnen aufgenommen wurden
Recycling tagging: Kennzeichnen recyclingfähiger Materialien mit farbigen Markierungen

Für unsere Kunden wäre die Erstellung qualitativ hochwertiger Trainingsdaten ein sehr zeitintensives Thema. Wir ermöglichen und beschleunigen die Umsetzung ihrer Lösungen, indem wir diese Arbeit für sie übernehmen. LANZ.AI ist also Enabler und Accelerator.“

Bisher besteht LANZ.AI aus einem festen Mitarbeiter, nämlich Geschäftsführer und Gründer Daniel Lanz. Dies ist aber keineswegs ein Nachteil, wie sich durch Daniels berufliche Laufbahn erkennen lässt.

LANZ.AI ist: Über 20 Jahre Erfahrung

„Ich habe über 20 Jahre in den Bereichen Digitalisierung, Datenerfassung und Software-Automation gearbeitet und war lange Geschäftsführer eines Digitalisierungsunternehmens. Daher weiß ich, wie groß der Bedarf an hochwertigen Daten für die Automatisierung von Prozessen ist, und warum die Spezifikation und ein zuverlässiger Partner für die Dateneingabe so wichtig sind“, berichtet Daniel von seinen eigenen Erfahrungen als Geschäftsführer des Software- und Digitalisierungs-Unternehmen Content Conversion Specialists. Aber obwohl Trainingsdaten so wichtig für die Prozessoptimierung sind, werden sie oft stiefmütterlich behandelt. Niemand hier hat Lust, fünf Stunden lang Fotos zu annotieren. Deshalb werden Trainingsdaten oft mehr schlecht als recht von Projektleitern oder Werkstudenten erstellt. Entsprechend schlecht sind die Ergebnisse der KI-Lösung.“

Dabei benötige man für ein optimales Ergebnis ein möglichst gutes Set an Trainingsdaten. Außerdem werde maschinelles Lernen in immer mehr Bereichen wichtig, wie auch die Homepage von LANZ.AI verrät: Von der Identifizierung von Verkehrsteilnehmern beim autonomen Fahren über die Früherkennung von Krankheiten im Gesundheitswesen bis hin zur Erfassung von handschriftlichen Dokumenten in der Verwaltung oder im Bereich des Kulturerbes.

„Für die Qualität der Trainingsdaten ist das detaillierte Ausarbeiten der Spezifikation essentiell. Dies fehlt häufig Dienstleistern, die ebenfalls Trainingsdaten erstellen. Da ich diese Problematik aus jahrelanger Projekterfahrung kenne, habe ich mich schließlich auf diese Thematik konzentriert und 2018 LANZ.AI gegründet“, erzählt Daniel, „Das Thema rund um künstliche Intelligenzen und Trainingsdaten finde ich sehr spannend. Es ist ein interessanter Zukunftsbereich, in dem ich noch viel Potential sehe. Denn er bietet in so vielen Bereichen neue Möglichkeiten für dramatische Verbesserungen. Die Faszination für Automatisierung und Verbesserung von Prozessen ist der Grund, warum ich LANZ.AI gegründet habe.“

LANZ.AI ist: Sozial und vertrauenswürdig

Dies zeigt sich auch darin, mit welchen Partnern LANZ.AI zusammenarbeitet: „Wir arbeiten mit Digital Divide Data zusammen, einer Nonprofit-Gesellschaft, deren Ziel es ist, junge, unterprivilegierte Menschen in Afrika und Südost-Asien in Beschäftigungsverhältnisse zu bringen und ihnen dadurch nachhaltige Möglichkeiten zu eröffnen.

Beim Thema Outsourcing denkt man oft: Da werden Menschen ausgenutzt oder Jobs gehen in Deutschland verloren.  Mit dem impact sourcing Ansatz von DDD sorgen wir hingegen dafür, dass Menschen konkret in Kenia, Laos und Kambodscha eine echte Perspektive erhalten. Diese Leute arbeiten sehr engagiert und motiviert an Dateneingabe-Jobs, die in Deutschland eher lustlos und letztlich mit schlechter Qualität erledigt werden. Und die Projektmitarbeiter in Deutschland können sich um höherwertige Tätigkeiten kümmern, die ihnen vermutlich auch mehr Spaß machen.

Ich war selbst vor Ort in Laos bei DDD und habe mehr als 10 Jahre mit DDD in vielen großen Digitalisierungs-Projekten zusammengearbeitet.“

Wichtig ist, so betont Daniel, dass mit dem Konzept von Social Entrepreneurship und Impact Sourcing soziale Probleme in den Ländern vor Ort innovativ angegangen werde.

LANZ.AI ist: Branchenunabhängig

„Manchmal müssen vertrauliche Daten jedoch in Europa oder sogar innerhalb des Firmengebäudes in Deutschland bleiben“, erklärt Daniel, „Auch das ist für LANZ.AI kein Problem. Wir arbeiten auch mit deutschsprachigen Partnern in Osteuropa zusammen und können relativ viele Szenarien realisieren.“

„Unsere ersten Kunden sind aus den Bereichen Agrarwesen und Raumfahrtindustrie. Satellitenbilder ermöglichen eine wesentlich effizientere Steuerung von Ressourcen im Agrarsektor. Zum Beispiel kann so festgestellt werden, welche Felder bewässert werden müssen oder abgeerntet werden können oder in welchen Bereichen ein Schädlingsbefall vorliegt. Aber auch im Maintenance-Bereich von großen Chemiewerken können Trainingsdaten und maschinelles Lernen hilfreich sein, beispielsweise bei der automatisierten Inspektion von Rohrsystemen. Menschen werden müde und machen Fehler, wenn sie stundenlange Videoaufzeichnungen anschauen. Computer liefern für solche Fälle bessere Ergebnisse.“

Eine Beschränkung der Bereiche, in denen Trainingsdaten von seinem Startup bearbeitet werden können, gibt es jedoch nicht: „LANZ.AI ist branchenunabhängig. Das einzige, was wir nicht leisten, ist das sogenannte Spezialistentagging.“ Gemeint ist damit die Bearbeitung der Trainingsdaten durch Experten aus dem jeweiligen Feld. Auf den ersten Blick scheint dies eine Einschränkung zu sein, doch, wie Daniel erklärt: „In überraschend vielen Fällen benötigt man beim Tagging keine spezielles Domain-Wissen. Es muss nur eine präzise, eindeutige Definition für die möglichen Labels und Tags existieren. Bilder sind beispielsweise sogar sprachenunabhängig. Wir können daher auch sehr gut international arbeiten.“

LANZ.AI ist: Mutig

Im Vergleich zu anderen Ländern sieht Daniel in Deutschland einige Schwierigkeiten für Startup-Gründer: „Ich denke, in den USA wird sehr positiv und optimistisch mit Startups zusammengearbeitet, insbesondere im Bezug auf Risiken und Möglichkeiten. In Deutschland ist es hingegen ein großes Manko, dass man kaum ermutigt wird, diesen Schritt zu gehen. Für Gründer ist es daher oft schwierig. Natürlich muss man sich kritisch auseinandersetzen, aber Ermutigung ist bei der Unternehmensgründung besonders wichtig.“

Dies könnte auch mit der sogenannten ‚Fehlerkultur‘ zusammenhängen, die er gerade in Deutschland kritisiert: „In Deutschland liegt der Fokus bei Fehlern leider auf dem Schaden, den der Fehler verursacht, und nicht dem Lerneffekt. Aber ohne Fehler erzielt man keinen Fortschritt. Fehler sind an sich nichts Schlechtes, denn durch sie lerne ich am meisten.“

Daher empfiehlt er anderen Startup-Gründern, Fehler auch als Möglichkeiten für Verbesserungen zu sehen. „Außerdem würde ich mir mehr Mut in Deutschland wünschen, besonders, was Startups angeht. Netzwerke können da einen großen Beitrag leisten. Sie können nicht nur gezielt Kontakte herstellen, sondern auch Gründer, die häufig mit Zweifeln konfrontiert sind, ermutigen. Das habe ich auch bei 5-HT so erlebt“, erinnert sich Daniel. Von Startups im Netzwerk von 5-HT erhofft sich Daniel für LANZ.AI neue Partnerschaften rund um das Thema Machine Learning und Trainingsdaten. Unternehmen, die den Bereich der Trainingsdaten auslagern oder sich dazu beraten lassen möchten, sind bei LANZ.AI natürlich willkommen.


Diesen Beitrag Teilen

Newsletteranmeldung

Werden Sie Teil des 5-HT Digital Hub Chemistry & Health

Tauschen Sie sich mit innovativen Startups und etablierten Unternehmen in unserem Netzwerk aus.