Die KI-Evolution auf dem Smartphone

Die Chips in modernen Smartphones besitzen spezialisierte Recheneinheiten, die Anwendungen auf Basis Künstlicher Intelligenz stark beschleunigen beziehungsweise verbessern.
Zu den schon länger auf Smartphones verfügbaren KI-Anwendungen zählen etwa Bildbearbeitung, Sprachassistenten, Eingabehilfen oder Textkorrektur-Funktionen.
Die neueste Generation von KI-optimierter Hardware und Software ergänzt nun überdies die Bestimmung beliebiger Objekte, Dialoge in natürlicher Sprache, Übersetzungen, Dolmetscher-Funktionen sowie Anwendungen auf Basis generativer KI („GPT“ – Generative Pre-trained Transformers).

In den Mikroprozessoren – oder technisch exakter: SoCs, System-on-a-Chip, also den zentralen Chips – moderner Smartphones sorgen spezialisierte Recheneinheiten dafür, dass Anwendungen auf Basis Künstlicher Intelligenz stark beschleunigt ausgeführt werden können. Denn „KI“-basierte Funktionen spielen auf modernen Smartphones eine zunehmend wichtige Rolle. Deren Einsatzgebiete sind breit verteilt.

Schon die Optimierung von Fotos zählt zu den entsprechend unterstützen Funktionen. KI-Verfahren sind stark in der Erkennung von Mustern und Strukturen in Bildern. Mit ihrer Hilfe kann die Smartphone-Software zum Beispiel identifizieren, welche Teile in einem von der Smartphone-Kamera aufgenommenen Foto Himmel, Pflanzen, Haut oder Wasser sind. Mit gezielten Bildoptimierungs-Funktionen lassen sich dann die vom Kamerasensor aufgenommenen Strukturen und Farben herausarbeiten. Das durch KI-Berechnungen verbesserte Ergebnis gefällt den meisten Betrachtern besser als das unbearbeitete Original. In der Fachsprache werden solche Funktionen auch als „Computational Photography“ – auf Berechnungen basierende Fotografie – bezeichnet.

Grundsätzlich jedoch erfordern KI-Systeme größere Datenmengen, um die durch „Training“ erlernten Rechenvorschriften auf neue Aufgabenfelder anwenden zu können. Für bestimmte Basisaufgaben können diese Datenbestände gemeinsam mit den zuständigen Apps auf dem Smartphone hinterlegt sein. Größere oder für ungewöhnlichere Aufgaben ausgelegte KI-Datenbanken werden hingegen im Netz gespeichert, wohin die App dann die jeweiligen Berechnungs-Aufgaben auslagern. Deshalb brauchen komplexere KI-Anwendungen in der Regel eine Mobilfunkverbindung ins Internet.

SPRACHASSISTENTEN UND TIPPFEHLERKORREKTUR DANK KI

Ein weiteres Anwendungsfeld von KI auf Smartphones ist die Erkennung von Spracheingaben und die Ausgabe von Antworten durch künstlich generierte Sprache im Rahmen der weit verbreiteten Sprachdialogsysteme. Auch hier tragen vor allem die Fähigkeiten von KI-Systemen zur Mustererkennung und -analyse zu flüssigeren Dialogen und besseren Ergebnissen bei der Erkennung von Spracheingaben bei.

Ähnliches gilt im Übrigen auch für die Schreibunterstützung auf virtuellen Smartphone-Tastaturen. Sie macht nicht nur Vorschläge bei angenommenen Tippfehlern, welches Wort wohl gemeint gewesen sein könnte, sondern blendet auch Kandidaten für Folgewörter ein, die nach Hochrechnung der KI die höchste Wahrscheinlichkeit haben, als nächstes Wort in einer Texteingabe zu folgen. Auch der nächste Schritt, eine automatische Rechtschreibkorrektur, basiert auf diesen Prinzipien. Zwar kann wohl jeder von Fehleinschätzungen dieser Automatikfunktion berichten – doch mit jeder Generation, zunehmendem Training durch die Unmengen der von allen Smartphone-Nutzern getippten Eingaben und immer leistungsfähigeren KI-Berechnungen in den neuesten Smartphone-Chips steigt die Qualität solcher Funktionen, während ihre Fehlerraten sinken. Die neueste Generation dieser Funktionen liefert zum Beispiel auf Wunsch des Benutzers per Fingertipp in Sekundenbruchteilen alternative Formulierungsvorschläge.

PFLANZEN, Vögel oder beliebige objekte identifizieren

Auf der Erkennung von Mustern beziehungsweise Objekten in Bildern basieren auch Apps, die bei der Bestimmung von Pflanzen oder Vögeln helfen. Selbst eine völlig freie Bilderkennung nach dem Motto „Was ist das, was meine Smartphone-Kamera gerade sieht?“ ist mittlerweile möglich. Die Bestimmung wird in der Regel heute noch im Internet und somit in leistungsfähigen Rechenzentren durchgeführt – doch mit wachsender KI-Rechenleistung auf modernen Smartphones kann sie auch zunehmend lokal, auf dem eigenen Endgerät erfolgen.

Mit der Funktion „Circle to Search“ erlaubt die neueste Android-Version auf den jüngsten Smartphone-Modellen mit gezielter KI-Unterstützung die Suche beziehungsweise den Abruf von Zusatzinformationen zu beliebigen Inhalten.

In den jüngsten Versionen des Smartphone-Betriebssystems Android wurde diese Funktion in Form der neuen Bedienkürzels „Circle to Search“ umgesetzt. Der Nutzer kann beliebige Inhalte auf Webseiten, in Apps oder in selbst aufgenommenen Fotos markieren und einen internet-gestützten Suchassistenten befragen, worum es sich handelt, beziehungsweise um Zusatzinformationen zum markierten Objekt bitten. Das Apple-System iOS dürfte mit einer vergleichbaren Funktion demnächst nachziehen.

GEnerative ki erzeugt texte und bildinhalte

Mustererkennung ist aber nur eine der vielen Anwendungen, die sich mit Künstlicher Intelligenz optimieren lassen. Eine wichtige Rolle spielen auch die Funktionen, die seit etwa anderthalb Jahren unter dem Schlagwort „GPT“ bekannt wurden. Das Kürzel steht ausgeschrieben für Generative Pre-trained Transformers und bezeichnet den Einsatz von KI-Verfahren zum Erzeugen von Texten oder Bildern. Das Prinzip, das insbesondere durch Sprachmodelle wie ChatGPT bekannt wurde, fließt auch mit ein, wenn Sprachdialogsysteme natürlicher klingende Antworten formulieren oder Bildbearbeitungs-Apps weiter reichende Bearbeitungen an Fotos vornehmen.

Mit generativer KI lassen sich beispielsweise auch unerwünschte Bildinhalte aus einem Foto entfernen und etwa durch den an dieser Stelle verdeckten Bildhintergrund ersetzen. Ist ein Bild schief geraten, kann es die KI gerade rücken und die an den Rändern fehlenden Bildinhalte ersetzen. Klar umrissene Elemente wie etwa Personen lassen sich verschieben, auch in diesem Fall ergänzt die KI den dann im Hintergrund fehlenden Bildinhalt.

Ebenso ist es aber auch möglich, nicht vorhandene Objekte in einem Bild zu ergänzen. Auf entsprechendes Benutzerkommando kann ein generatives KI-System in einem Foto beispielsweise ein Haus oder einen Baum hinzufügen oder einen asphaltierten Parkplatz durch eine Wiese ersetzen. In dieser Hinsicht unterscheiden sich Bildbearbeitungs-Apps auf dem Smartphone nicht von vergleichbaren Programmen auf stationären PCs oder entsprechenden Anwendungen im Web. Die damit verbundenen Grundfragen – etwa: sollte es verpflichtend sein, dass Bilder, die nicht mehr die Realität abbilden, als KI-bearbeitet gekennzeichnet werden? – treffen demnach auch für alle diese technischen Umsetzungen gleichermaßen zu.

ki-basierte übersetzungen bis hin zur dolmetscherfunktion

Das KI-basierte Verständnis von Textinhalten und die von generativer KI ermöglichte Formulierung eigener Texte ist auch die Basis von Übersetzungs-Apps. Ihre aktuellen Vertreter können nicht nur digital vorliegende Texte (etwa Nachrichten, E-Mails oder Textdateien) in eine andere Sprache übersetzen, sondern leisten dies auch für gesprochene Eingaben oder sogar fotografierte Schilder, Speisekarten und ähnliche Textvorlagen. Da die Berechnungszeiten durch die KI-Unterstützung in der neuesten Generation von Smartphone-Prozessoren immer kürzer werden, wird sogar eine Art Live-Übersetzung möglich – sei es bei einem Telefonat mit einem fremdsprachigen Kommunikationspartner oder beim App-unterstützten „Dolmetschen“ eines Gesprächs mit anderssprachigem Service- oder Verkaufspersonal im Urlaubsland.

Mit den jüngsten Fortschritten in puncto Rechenleistung und Weiterentwicklung von KI-Anwendungen haben auch die beschriebenen Funktionen und Einsatzgebiete einen großen Schritt nach vorn gemacht. Dennoch dürfte die gesamte Entwicklung noch am Anfang stehen – schnelle Weiterentwicklungen in Qualität und Leistung auf diesem Gebiet sind so gut wie sicher.

Veröffentlicht am 01.02.2024

Wie steht es bei KI-Anwendungen um den Daten- und Persönlichkeitsschutz?

Grundsätzlich basiert vor allem das Training von KI-Systemen in der Regel auf realen Nutzerdaten. Vor allem um diesen Aspekt drehen sich Bedenken, wie es bei der Verwendung dieser Daten um den Daten- und Persönlichkeitsschutz der Anwender bestellt ist. Die Regel dafür setzen die Rechtssysteme in den Ländern der jeweiligen Anbieter – tendenziell legen beispielsweise die EU-Staaten, die ohnehin einen detaillierten Rechtsrahmen für Künstliche Intelligenz planen, auf diesen Aspekt größeren Wert als etwa die Gesetzgebung in den USA.

Die Anbieter und Hersteller argumentieren, dass die Nutzerdaten beim Training von KI-Anwendungen ausreichend anonymisiert seien. Einzelne Beispiele zeigen aber, dass dies nicht immer zutrifft beziehungsweise nicht zu 100 Prozent gelingt. Besonders auffällig ist dieser Effekt bei KI-generierten Bildern, in denen die von der Künstlichen Intelligenz hinzugefügten Inhalte zumindest an Bildinhalte erinnern können, die von urheberrechtlich geschützten Fotografen oder Künstlern stammen. Zweifellos müssen viele Aspekte der noch insgesamt sehr jungen KI-Technik und -Anwendungen sowie der Datennutzung für solche Zwecke noch geklärt und gesellschaftlich ausverhandelt werden.

Über rein juristische und technologische Fragen hinaus hat dies aber auch eine ethische Dimension. Bereits im März 2023 hatte der Deutsche Ethikrat deshalb eine Stellungnahme unter dem Titel „Mensch und Maschine – Herausforderungen durch Künstliche Intelligenz“ (www.ethikrat.org) veröffentlicht und darin unter anderem gefordert: „„Der Einsatz von KI muss menschliche Entfaltung erweitern und darf sie nicht vermindern. KI darf den Menschen nicht ersetzen.“

Auch komplexe Wechselwirkungen zwischen Mensch und Technik sowie gesellschaftliche Effekte müssten demnach beachtet werden. Wenn menschliche Tätigkeiten an Maschinen delegiert werden, sei es wichtig, genau hinzuschauen, für wen dies mit erweiterten Handlungsspielräumen verbunden ist und wessen Handlungsmöglichkeiten eher vermindert werden. Um dies zu gewährleisten, hat der Ethikrat Empfehlungen zum Einsatz von KI insbesondere für die Bereiche Medizin, schulische Bildung, öffentliche Kommunikation und Meinungsbildung sowie öffentliche Verwaltung formuliert. KI müsse zur Entscheidungsunterstützung und dürfe nicht zur Entscheidungsersetzung verwendet werden und solle menschliche Kontrolloptionen nicht beeinträchtigen. Weitere Forderungen zielen darauf ab, Verzerrungen, Abhängigkeiten und Missbrauch von Technik sowie unerwünschte Verluste menschlicher Fertigkeiten zu vermeiden. Über alle Anwendungsbereiche hinweg gelte es, die Interessen der Menschen, von denen die in KI-Anwendungen verwendeten Daten stammen, in den Mittelpunkt zu stellen, übermäßige Eingriffe in die Privatsphäre mithilfe effektiver rechtlicher und technischer Vorkehrungen zu verhindern und gleichzeitig eine gemeinwohlorientierte Datennutzung zu ermöglichen.