Es kann Language Large Models (LLMs) wie ChatGPT und Google Bard bereitstellen manche Gute Antworten auf bestimmte Arten von Fragen, aber ironischerweise sind diese Computer ziemlich schlecht im Rechnen. Google hat eine neue Lösung für den Versuch, Sprachmodelle dazu zu bringen, einfache Aufgaben wie Mathematik zu erledigen, richtig: Holen Sie sich KI Schreiben Sie ein Programm. Google sagt, dass, wenn Sie dem Bard jetzt eine „Rechenaufgabe“ wie Mathematik oder String-Manipulation stellen, statt die Ausgabe eines Sprachmodells anzuzeigen, dieses Sprachmodell stattdessen ein Programm schreibt, dieses Programm ausführt und dann die Ausgabe davon anzeigt als Antwort an den Benutzer senden.
Ein Google-Blogbeitrag liefert ein Beispiel für einen Eintrag, der „das Wort ‚Lollipop‘ für mich umkehrt“. ChatGPT dreht diese Frage um und gibt die falsche Antwort „pillopoL“, weil Sprachmodelle die Welt in Wortteilen oder „Symbolen“ sehen und darin nicht sehr gut sind. Hier ist eine Beispielausgabe von Bard:
Sie erhalten die korrekte Ausgabe als „popilloL“, aber was noch interessanter ist, ist das auch Enthält Python-Code Ich habe geschrieben, um die Frage zu beantworten. Das ist großartig für Programmierinteressierte, um zu sehen, was sich hinter der Haube verbirgt, aber wow, für normale Leute ist das wahrscheinlich der gruseligste Ausweg. Es ist auch nicht besonders relevant. Stellen Sie sich vor, Gmail würde Ihnen einen Codeblock anzeigen, als Sie gerade darum gebeten haben, die E-Mail abzurufen. Es ist komisch. Erledigen Sie einfach die Arbeit, die Sie erledigen sollen, cool.
Google vergleicht ein KI-Modell, das ein Programm schreibt, mit Menschen, die lange Divisionen durchführen, da es sich dabei um eine andere Denkweise handelt:
Dieser Ansatz ist von einem gut untersuchten Dualismus in der menschlichen Intelligenz inspiriert, der speziell in Daniel Kahnemans Buch behandelt wird Schnelles und langsames DenkenTrennen Sie das Denken von „System 1“ und „System 2“.
- System-1-Denken ist schnell, intuitiv und einfach. Wenn ein Jazzmusiker auf der Stelle improvisiert oder wenn jemand an ein Wort denkt und zusieht, wie es auf dem Bildschirm erscheint, verwendet er das System-1-Denken.
- Im Gegensatz dazu ist das Denken in System 2 langsam, bewusst und mühsam. Wenn Sie lange Divisionen durchführen oder lernen, ein Instrument zu spielen, verwenden Sie System 2.
In dieser Analogie kann davon ausgegangen werden, dass das LLM nur unter System 1 arbeitet – es produziert schnell, aber ohne viel Nachdenken einen Text. Dies führt zu einigen erstaunlichen Fähigkeiten, kann jedoch auf erstaunliche Weise zu kurz kommen. (Stellen Sie sich vor, Sie versuchen, ein mathematisches Problem allein mit System 1 zu lösen: Sie können nicht anhalten und rechnen, sondern müssen nur die erste Antwort ausgeben, die Ihnen in den Sinn kommt.) Klassische Berechnungen sind eng mit System 2 verknüpft Denken: Es ist ein formelhafter und unflexibler Prozess, aber die richtige Abfolge von Schritten kann zu beeindruckenden Ergebnissen führen, beispielsweise zu langen Divisionslösungen.
Laut Google wird die „Code on the Fly“-Methode auch für Fragen wie „Was sind die Primfaktoren von 15.683.615?“ verwendet. und „Berechnen Sie die Wachstumsrate meiner Ersparnisse.“ Das Unternehmen sagt: „Bisher haben wir gesehen, dass diese Methode die Genauigkeit von Bards Antworten auf rechnerische Wort- und Mathematikprobleme in unseren internen Herausforderungsdatensätzen um etwa 30 % verbessert.“ Wie üblich warnt Google den Barden: „Möglicherweise macht er es nicht richtig“, weil er Ihre Frage falsch interpretiert oder einfach, wie wir alle, Code schreibt, der beim ersten Mal nicht funktioniert.
Bard codiert gerade schnell die Antworten, wenn Sie es unter bard.google.com ausprobieren möchten.