Neue Technologien: Multimodale Transformer-Modelle, die Cloud und ME*N & ASP.NET- Freelance Junior berichtet

Autonomes Fahren, Blockchain und Quantencomputer. Was haben all diese Begriffe gemeinsam? Sie gehören neuen Technologien an, die unser Leben und unser Arbeiten effektiver, sicherer und nachhaltiger machen sollen. Die Beweggründe für moderne Entwicklungen könnten nicht offensichtlicher als heutzutage sein: Unsere Ressourcen schwinden und wir müssen energiesparender und weniger verschwenderisch durchs Leben gehen – Geld spielt dabei auch natürlich immer noch eine große Rolle. Besonders in den Unternehmen führt die Ausbreitung neuer Technologien zu Veränderungen und Reformen, kaum eine Nische bleibt davon verschont. Während einige Anwendungen und Entwicklungen schon nahezu ausgereift sind, stehen andere noch am Anfang.

Um Ihnen einen besseren Überblick zu verschaffen, hat Freelance Junior – eine Plattform für aufstrebende Freelancer:innen – drei seiner Freelancer:innen aus der Community folgende Frage gestellt: Welches sind deine neusten Lieblings-Technologien? Das Ergebnis soll Ihnen natürlich nicht vorenthalten werden.

Multimodale Transformer-Modelle – was ist das für eine neue Technologie?

Filipe Laitenberger aus der Freelance-Junior Community ist 22 Jahre alt und studiert an der Universität Groningen Artificial Intelligence. Nebenbei arbeitet er als freiberuflicher Software-Entwickler und baut Webseiten, Shops und komplexe Server-Programme. Zum Beispiel entwickelt Filipe zurzeit ein System, mit dem Anwälte ihr Klient:innen-Management inklusive Mail- und Zahlungsverkehr vollständig automatisieren können.

Filipe interessiert sich aus Leidenschaft für das Thema Machine Learning.

Zur Zeit schreibt er seine Bachelor-Arbeit. Der ständige Begleiter seiner Gedanken sowie (Alb-)Träume ist Folgender: Multimodale Transformer-Modelle

Was wie der nächste Actionfilm klingt, ist in Wirklichkeit ein Computermodell, welches lernt gleichzeitig Text zu lesen und Bilder zu verstehen. Dadurch soll die KI im Endeffekt in der Lage sein, sich beispielsweise das Bild einer Person anzusehen, und auf eine Frage, wie “Welche Farbe hat die Jacke der Person?”, mit “schwarz” zu antworten.

Dass ein Modell solch eine Aufgabe bewältigen kann, ist aber nichts Neues! Auch andere Forscher haben solche Künstlichen Intelligenzen schon mit Erfolg gebaut. Allerdings waren diese KIs immer aus verschiedenen Bausteinen zusammengesetzt, die auf das Verstehen von bspw. Bild und Text individuell angepasst waren.

Filipe beschäftigt sich in seiner Arbeit mit der Frage: ”Was wäre, wenn eine Künstliche Intelligenz nur einen zentralen Baustein hätte, durch den sie sowohl Bildverständnis als auch Textverständnis erlernen könnte?”

Das reicht Filipe noch nicht, er will noch tiefer in die Materie eintauchen:

“Wenn eine Maschine eine Vielzahl an Sinnen gleichzeitig erlernen könnte, könnte sie womöglich auch generelles Verständnis über die Welt erlangen. Diese sogenannte General Intelligence ist der heilige Gral der KI-Forschung. Dennoch sind wir davon meilenweit entfernt. Einen Beitrag dazu zu leisten, will ich mir aber nicht nehmen lassen.”

MUM – die Zukunft unserer Google-Suche?

Jeder, der sich für das Thema multimodale Modelle interessiert, hat sicherlich schonmal was vom Multitask Unified Model oder auch kurz MUM gehört. MUM ist eine neue Technologie für die Google-Such Funktion und kann genauso wie die Multimodalen Transformer-Modelle aus Filipes Bericht komplexere Fragen beantworten.

Die künstliche Intelligenz arbeitet mit multimodalen Daten und kann auch Audio-, Video- und Bilddateien verwerten. Die Google-Suche basiert in diesem Fall nicht mehr auf einzelnen Begriffen, die im Index gesucht werden, sondern auf Natural-Language-Processing und kann somit die Suchintention tiefer verstehen. Zum Beispiel kann durch eine Kombination aus Text und Bild ein genaues Verständnis darüber erlangt werden, was tatsächlich gesucht wird. Gut anwenden lässt sich dieser Fall im Mode-Bereich, wenn beispielsweise nach einer passenden Hose zum Hemd gesucht wird: Einfach ein Bild des Hemds und eine kurze Beschreibung hochladen und schon kommen passende Muster und Outfit-Vorschläge bei Google-Shopping. Daraus lässt sich gleichzeitig schlussfolgern, dass sich das Ranking Verhalten bezüglich SEO verändern wird, jedoch kann ein viel tieferes Wissen und bessere Antworten vermittelt werden. Bis das soweit ist, wird es allerdings noch einige Zeit dauern.

Die Cloud als Vorreiter der neuen Technologien

Klaus Lichtblau ist 23 Jahre alt und kommt aus dem Umland Augsburgs. Er hat sich bereits als Kind für Technik und Computer interessiert und 2014 seine Ausbildung zum Fachinformatiker für Systemintegration angefangen und sein Wirtschaftsinformatikstudium direkt hinten drangehangen. Neben dem Studium beschäftigt er sich beispielsweise mit dem Themengebiet Blockchain Technology.

Seine Ausbildung hat Klaus bei einem Microsoft Dienstleister in Augsburg absolviert. Hierbei drehte sich bereits ein Großteil der Arbeit um die Migration klassischer On-Premise Lösungen hin zur Cloud. Dass die Cloud vielen Unternehmen beim Kosten senken hilft, war also von Beginn an fest in seinem Denken verankert – welchen Nutzen man darüber hinaus beim ortsunabhängigen Arbeiten ziehen können, wurde dann mit Beginn der Corona Pandemie noch besser ersichtlich.

Grundsätzlich ist es heute möglich, nahezu jede Anwendung und jeden Geschäftsprozess zu digitalisieren. Am spannendsten hierbei findet Klaus jedoch den Wandel der zwischenmenschlichen Kommunikation. Kollaborationssysteme wie Microsoft Teams bieten Unternehmen eine leistungsstarke Plattform, um das gemeinsame Arbeiten orts- und zeitunabhängig zu gestalten. So ist die weitbekannte Videochatfunktion eigentlich nur ein kleiner Teil des Funktionsumfangs. Ob Ticketsystem, Chatbot oder Zeiterfassung. Grundsätzlich können all diese Anforderungen problemlos realisiert werden und oftmals sogar noch mit Software von Drittanbietern verknüpft werden.

Klaus findet daran besonders überzeugend, dass selbst kleine Unternehmer:innen diese Möglichkeiten ohne überdimensionierte Anschaffungskosten nutzen können. Selbst für die Umwelt hat das digitale Arbeiten viele Vorteile. So gibt es beispielsweise bereits Consultingfirmen, welche Vor-Ort-Termine vollständig durch den digitalen Austausch ersetzt haben – und somit zertifiziert klimaneutral sind.

Cloud vs. On-Premise – was ist besser?

On-Premise Lösungen funktionieren sehr gegensätzlich zu einer Cloud, da ersteres nur intern verfügbar und die Installation einer Software notwendig ist. Bei einer Cloud dagegen werden die Daten auf externen Servern verwaltet, weshalb man egal von wo und wann darauf zugreifen kann. Unternehmen, die besonders hohe Datenschutzanforderungen haben, entscheiden sich daher eher für On-Premise Lösungen und haben folglich nur im eigenen Haus Zugriff darauf. Dafür ist der käufliche Erwerb einer Lizenz notwendig, was einerseits höhere Anschaffungskosten, aber gleichzeitig die vollständige Kontrolle über das System bedeutet.

Viele Unternehmen versuchen heutzutage jedoch, mit der Digitalisierung und dem sich wandelnden Arbeitsklima – Stichwort New Work – mitzugehen und verwenden vermehrt einen Cloud-Service. Zu den sogenannten SaaS (“Software as a Service”) Prinzipien benötigt man nichts weiter als ein internetfähiges Gerät, was einem die Arbeit genauso im Home Office als auch in der Karibik ermöglicht.

Wofür entscheidet man sich denn jetzt?

Das hängt ganz davon ab, was für einen Aufwand und Kosten man selbst investieren möchte und was von dem System erwartet wird. Wenn der Faktor “unabhängiges Arbeiten” überwiegt und Kosten gespart werden sollen, wäre ein Cloud Service die richtige Lösung. Die Prozesse und Vorgänge sind hierbei bereits fest vorgefertigt und Updates und neue Funktionen werden automatisch übernommen.

Eine On-Premise Lösung hat dagegen einen höheren Kostenaufwand und die Daten können nur lokal abgerufen werden. Dafür besitzt man jedoch eine größere Kontrolle, kann Prozesse individuell anpassen und Datenschutzanforderungen garantieren.

Zwei Stack Modelle in den Favoriten der neuen Technologien

Glenn Kintscher ist 23 Jahre alt und Geschäftsführer seiner eigenen Firma Aptenobits, die Unternehmen bei der Softwareentwicklung berät und unterstützt. Glenn hat bereits mit Kund:innen jeglicher Größenordnung gearbeitet: von Einzelpersonen über inländische Unternehmen bis hin zu weltweit operierenden S&P 500-Unternehmen. Nebenbei studiert er Informatik an der Fernuniversität Hagen und interessiert sich für den gesamten Entwicklungszyklus agiler Projekte und diverse Programmiersprachen.

Glenns Kund:innen und er selbst arbeiten aktuell hauptsächlich mit zwei Stack Modellen: ME*N (MongoDB, Express.js, Frontend Library wie Vue/React/Angular und Node.js) und ASP.NET (Modern.NET, IIS, SQL Server). Der ME*N Stack ist zwar sehr praktisch, um schnell und unkompliziert Prototypen zu basteln, da alles sehr flexibel ist und es keine strikten Typen/Schemata gibt, aber er persönlich bevorzugt den ASP.NET Stack. Ein Unterschied macht dabei immer die Situation und die Anforderungen des Projekts, aber allgemein arbeitet Glenn lieber mit einer stark typisierten Programmiersprache (wie z.B. C#), als mit einer schwach typisierten (wie z.B. JavaScript) – gleiches gilt auch für das Datenbankschema. Hierbei haben relationale Datenbanken wie PostgreSQL ein striktes Schema, wobei Dokumentendatenbanken wie MongoDB eine hohe Flexibilität aufweisen.

Glenn verfolgt persönlich als auch arbeitstechnisch gerne Microsoft-Ankündigungen / Events und freut sich immer auf neue Technologien und Funktionen. Aktuell liegt der Fokus dort auf Blazor und .NET MAUI – zwei Frameworks, die sowohl Web- als auch native Anwendungen modernisieren und Cross-Platform-Kompatibel machen sollen. Besonders über die Updates zu Blazor freut Glenn sich, da Blazor aus seiner Sicht die Zukunft für skalierbare, aber vor allem auch wartbare Web-Anwendungen ist.

Was ist Blazor?

Mit Blazor können interaktive Web-UIs mit C# statt mit JavaScript erstellt werden. Blazor-Anwendungen bestehen aus wiederverwendbaren Web-UI-Komponenten, die mit C#, HTML und CSS implementiert werden. Sowohl der Client- als auch der Servercode ist in C# geschrieben, sodass Server-Logik problemlos im Client wiederverwendet und umgekehrt. Wer genauso viel Wert auf einen sauberen Code legt wie Glenn, wird mit dieser Technologie glücklich.

Neue Technologien von heute und morgen – Fazit📍

Eins steht fest: Neue Technologien entwickeln sich heutzutage rasant und bringen viel Umschwung und Veränderungen nicht nur in unser Arbeitsleben, sondern auch in die Gesellschaft. Das betrifft nicht nur Programmierer:innen, sondern jede:n einzelne:n, der:die diesen Artikel liest. Filipe, Klaus und Glenn sind leidenschaftlich an neuen Updates und Funktionen ihrer Lieblingstools interessiert – vieles davon verhilft uns zu effizienterem und digitalerem Arbeiten. Wie weit die Entwicklung der Multimodalen Transformer-Modelle, Cloud Lösungen und ME*N/ASP.NET Stacks tatsächlich noch geht, wird die Zukunft zeigen!

Schreibe einen Kommentar

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Nachrichten und Ratgeber für IT Freelancer  

   + kostenlos

   + kompakt

   + monatlich

   + spamfrei

Das Neueste zum Wettbewerb 'IT Freelancer des Jahres'

Newsletter des IT Freelancer Magazins