Sprechen Sie KI? Künstliche Intelligenz entsteht hauptsächlich auf Englisch, deutsche Texteingaben führten in der Vergangenheit oft zu schlechteren Ergebnissen. In diesen Fällen lohnt sich auch heute noch ein Switch ins Englische.
Also gerade was Formulierungen betrifft, finde ich ChatGPT oft noch "fremd". Nicht das Level von älteren automatischen Übersetzungen, aber teilweise doch ein bisschen unüblich.
Andererseits ist es schon beeindruckend, dass wir über sprachliche Nuancen diskutieren (und nicht Windows 10 mit " Fenster 10" übersetzt wird).
You can ask me in either German or English—whichever you feel more comfortable with. I am equipped to handle both languages and will provide you with the best possible responses in either.
War das nicht mal einer der Selling Points von dieser Form von KI, dass sie Sprachen verstehen, inklusiver solcher die sehr wenige Sprecher haben und entsprechend auch weniger menschliche Übersetzer?
Bei GPT-2 war es meines Wissens noch so, dass es nur Englisch sprach, jedenfalls bin ich davon ausgegangen und habe für deutsche Anwendungen German-GPT-2 verwendet. Dieses Modell war auf deutsche Texte trainiert: https://huggingface.co/dbmdz/german-gpt2.
Auf GPT-3 hatte ich keinen Zugriff, aber sein offenes Gegenstück GPT-Neo hatte definitiv schon ein paar Brocken Deutsch mit im Gepäck, war aber immer noch primär Englisch.
Mich hat es sehr überrascht, dass ChatGPT (GPT 3.5) auch Deutsch und andere Sprachen sehr gut verstand und produzierte. Hatte dies eben damals nicht als bewußt kommuniziertes Feature mitbekommen.
Meta hat gestern erst ein Paper zu Byte Latent Transformern veröffentlicht, das beachtliche Fortschritte bei der Ablösung von Tokenisierung aufzeigt. Tokenisierung ist derzeit noch eine Herausforderung für mehrsprachige Modelle, weil die Zerlegung nicht sprachangepasst ist.