- Die Chips in modernen Smartphones besitzen spezialisierte Recheneinheiten, die Anwendungen auf Basis Künstlicher Intelligenz stark beschleunigen beziehungsweise verbessern.
- Zu den schon länger auf Smartphones verfügbaren KI-Anwendungen zählen etwa Bildbearbeitung, Sprachassistenten, Eingabehilfen oder Textkorrektur-Funktionen.
- Die neueste Generation von KI-optimierter Hardware und Software ergänzt nun überdies die Bestimmung beliebiger Objekte, Dialoge in natürlicher Sprache, Übersetzungen, Dolmetscher-Funktionen sowie Anwendungen auf Basis generativer KI („GPT“ – Generative Pre-trained Transformers).
In den Mikroprozessoren – oder technisch exakter: SoCs, System-on-a-Chip, also den zentralen Chips – moderner Smartphones sorgen spezialisierte Recheneinheiten dafür, dass Anwendungen auf Basis Künstlicher Intelligenz stark beschleunigt ausgeführt werden können. Denn „KI“-basierte Funktionen spielen auf modernen Smartphones eine zunehmend wichtige Rolle. Deren Einsatzgebiete sind breit verteilt.
Schon die Optimierung von Fotos zählt zu den entsprechend unterstützen Funktionen. KI-Verfahren sind stark in der Erkennung von Mustern und Strukturen in Bildern. Mit ihrer Hilfe kann die Smartphone-Software zum Beispiel identifizieren, welche Teile in einem von der Smartphone-Kamera aufgenommenen Foto Himmel, Pflanzen, Haut oder Wasser sind. Mit gezielten Bildoptimierungs-Funktionen lassen sich dann die vom Kamerasensor aufgenommenen Strukturen und Farben herausarbeiten. Das durch KI-Berechnungen verbesserte Ergebnis gefällt den meisten Betrachtern besser als das unbearbeitete Original. In der Fachsprache werden solche Funktionen auch als „Computational Photography“ – auf Berechnungen basierende Fotografie – bezeichnet.
Grundsätzlich jedoch erfordern KI-Systeme größere Datenmengen, um die durch „Training“ erlernten Rechenvorschriften auf neue Aufgabenfelder anwenden zu können. Für bestimmte Basisaufgaben können diese Datenbestände gemeinsam mit den zuständigen Apps auf dem Smartphone hinterlegt sein. Größere oder für ungewöhnlichere Aufgaben ausgelegte KI-Datenbanken werden hingegen im Netz gespeichert, wohin die App dann die jeweiligen Berechnungs-Aufgaben auslagern. Deshalb brauchen komplexere KI-Anwendungen in der Regel eine Mobilfunkverbindung ins Internet.
SPRACHASSISTENTEN UND TIPPFEHLERKORREKTUR DANK KI
Ein weiteres Anwendungsfeld von KI auf Smartphones ist die Erkennung von Spracheingaben und die Ausgabe von Antworten durch künstlich generierte Sprache im Rahmen der weit verbreiteten Sprachdialogsysteme. Auch hier tragen vor allem die Fähigkeiten von KI-Systemen zur Mustererkennung und -analyse zu flüssigeren Dialogen und besseren Ergebnissen bei der Erkennung von Spracheingaben bei.
Ähnliches gilt im Übrigen auch für die Schreibunterstützung auf virtuellen Smartphone-Tastaturen. Sie macht nicht nur Vorschläge bei angenommenen Tippfehlern, welches Wort wohl gemeint gewesen sein könnte, sondern blendet auch Kandidaten für Folgewörter ein, die nach Hochrechnung der KI die höchste Wahrscheinlichkeit haben, als nächstes Wort in einer Texteingabe zu folgen. Auch der nächste Schritt, eine automatische Rechtschreibkorrektur, basiert auf diesen Prinzipien. Zwar kann wohl jeder von Fehleinschätzungen dieser Automatikfunktion berichten – doch mit jeder Generation, zunehmendem Training durch die Unmengen der von allen Smartphone-Nutzern getippten Eingaben und immer leistungsfähigeren KI-Berechnungen in den neuesten Smartphone-Chips steigt die Qualität solcher Funktionen, während ihre Fehlerraten sinken. Die neueste Generation dieser Funktionen liefert zum Beispiel auf Wunsch des Benutzers per Fingertipp in Sekundenbruchteilen alternative Formulierungsvorschläge.
PFLANZEN, Vögel oder beliebige objekte identifizieren
Auf der Erkennung von Mustern beziehungsweise Objekten in Bildern basieren auch Apps, die bei der Bestimmung von Pflanzen oder Vögeln helfen. Selbst eine völlig freie Bilderkennung nach dem Motto „Was ist das, was meine Smartphone-Kamera gerade sieht?“ ist mittlerweile möglich. Die Bestimmung wird in der Regel heute noch im Internet und somit in leistungsfähigen Rechenzentren durchgeführt – doch mit wachsender KI-Rechenleistung auf modernen Smartphones kann sie auch zunehmend lokal, auf dem eigenen Endgerät erfolgen.
Mit der Funktion „Circle to Search“ erlaubt die neueste Android-Version auf den jüngsten Smartphone-Modellen mit gezielter KI-Unterstützung die Suche beziehungsweise den Abruf von Zusatzinformationen zu beliebigen Inhalten.
In den jüngsten Versionen des Smartphone-Betriebssystems Android wurde diese Funktion in Form der neuen Bedienkürzels „Circle to Search“ umgesetzt. Der Nutzer kann beliebige Inhalte auf Webseiten, in Apps oder in selbst aufgenommenen Fotos markieren und einen internet-gestützten Suchassistenten befragen, worum es sich handelt, beziehungsweise um Zusatzinformationen zum markierten Objekt bitten. Das Apple-System iOS dürfte mit einer vergleichbaren Funktion demnächst nachziehen.
GEnerative ki erzeugt texte und bildinhalte
Mustererkennung ist aber nur eine der vielen Anwendungen, die sich mit Künstlicher Intelligenz optimieren lassen. Eine wichtige Rolle spielen auch die Funktionen, die seit etwa anderthalb Jahren unter dem Schlagwort „GPT“ bekannt wurden. Das Kürzel steht ausgeschrieben für Generative Pre-trained Transformers und bezeichnet den Einsatz von KI-Verfahren zum Erzeugen von Texten oder Bildern. Das Prinzip, das insbesondere durch Sprachmodelle wie ChatGPT bekannt wurde, fließt auch mit ein, wenn Sprachdialogsysteme natürlicher klingende Antworten formulieren oder Bildbearbeitungs-Apps weiter reichende Bearbeitungen an Fotos vornehmen.
Mit generativer KI lassen sich beispielsweise auch unerwünschte Bildinhalte aus einem Foto entfernen und etwa durch den an dieser Stelle verdeckten Bildhintergrund ersetzen. Ist ein Bild schief geraten, kann es die KI gerade rücken und die an den Rändern fehlenden Bildinhalte ersetzen. Klar umrissene Elemente wie etwa Personen lassen sich verschieben, auch in diesem Fall ergänzt die KI den dann im Hintergrund fehlenden Bildinhalt.
Ebenso ist es aber auch möglich, nicht vorhandene Objekte in einem Bild zu ergänzen. Auf entsprechendes Benutzerkommando kann ein generatives KI-System in einem Foto beispielsweise ein Haus oder einen Baum hinzufügen oder einen asphaltierten Parkplatz durch eine Wiese ersetzen. In dieser Hinsicht unterscheiden sich Bildbearbeitungs-Apps auf dem Smartphone nicht von vergleichbaren Programmen auf stationären PCs oder entsprechenden Anwendungen im Web. Die damit verbundenen Grundfragen – etwa: sollte es verpflichtend sein, dass Bilder, die nicht mehr die Realität abbilden, als KI-bearbeitet gekennzeichnet werden? – treffen demnach auch für alle diese technischen Umsetzungen gleichermaßen zu.
ki-basierte übersetzungen bis hin zur dolmetscherfunktion
Das KI-basierte Verständnis von Textinhalten und die von generativer KI ermöglichte Formulierung eigener Texte ist auch die Basis von Übersetzungs-Apps. Ihre aktuellen Vertreter können nicht nur digital vorliegende Texte (etwa Nachrichten, E-Mails oder Textdateien) in eine andere Sprache übersetzen, sondern leisten dies auch für gesprochene Eingaben oder sogar fotografierte Schilder, Speisekarten und ähnliche Textvorlagen. Da die Berechnungszeiten durch die KI-Unterstützung in der neuesten Generation von Smartphone-Prozessoren immer kürzer werden, wird sogar eine Art Live-Übersetzung möglich – sei es bei einem Telefonat mit einem fremdsprachigen Kommunikationspartner oder beim App-unterstützten „Dolmetschen“ eines Gesprächs mit anderssprachigem Service- oder Verkaufspersonal im Urlaubsland.
Mit den jüngsten Fortschritten in puncto Rechenleistung und Weiterentwicklung von KI-Anwendungen haben auch die beschriebenen Funktionen und Einsatzgebiete einen großen Schritt nach vorn gemacht. Dennoch dürfte die gesamte Entwicklung noch am Anfang stehen – schnelle Weiterentwicklungen in Qualität und Leistung auf diesem Gebiet sind so gut wie sicher.
Veröffentlicht am 01.02.2024