Beim Turing Test werden einem Computer und einem Menschen Fragen gestellt, um herauszufinden, wer von beiden ein Mensch ist. Wenn der Computer nicht vom Menschen zu unterscheiden ist, hat er den Turing Test bestanden.
Der Turing Test, eine der am häufigsten diskutierten Methoden zur Bewertung künstlicher Intelligenz (KI) , stammt aus den 1950er Jahren. Er entstand aus einem Gedankenexperiment des Informatikers Alan Turing, bei dem er etwas entwickelte, das er zunächst „The Imitation Game“ nannte. Bei diesem Test treten menschliche Probanden gegen eine Maschine an, um die Fähigkeit der Maschine zu testen, menschenähnliche Reaktionen und Intelligenz zu zeigen. Bis heute gilt der Turing Test allgemein als Maßstab für den Erfolg der KI-Forschung.
Wie funktioniert der Turing Test?
Der Turing Test wird durchgeführt, indem ein Mensch in einen Raum und eine Maschine in einen anderen Raum gesetzt wird. Anschließend stellt ein Richter oder eine Jury jedem Raum Fragen zu beliebigen Themen, auf die ein Mensch antworten können sollte. Wenn die Maschine den Turing Test bestanden hat, zeigt dies, dass sie in der Lage ist, menschliche Syntax und Semantik zu verarbeiten, was als ein Schritt in Richtung der Schaffung künstlicher allgemeiner Intelligenz gilt .
Unabhängig davon, ob ein Computer den Turing Test besteht, können wir nicht wirklich feststellen, ob eine Maschine menschliche Semantik wirklich versteht oder nicht. Der Test beurteilt Maschinen lediglich nach ihrer Fähigkeit, mit menschlicher Eloquenz zu kommunizieren, nicht nach menschlichem Verständnis. Diese Einschränkung hat einige KI-Forscher zu der Argumentation veranlasst, dass der Turing Test weniger relevant sei als früher.
Beispielfragen für den Turing Test
Obwohl es keine offizielle Liste mit Fragen für den Turing Test gibt, würde ein Juror wahrscheinlich Fragen stellen, die sich auf menschliche Erfahrungen wie Emotionen und Reifung beziehen, oder linguistische Rätsel, die für eine Maschine schwer zu lösen sein könnten. Hier sind einige Fragen, die Sie stellen sollten, wenn Sie einen Turing Test beurteilen:
- Welches Erlebnis in Ihrer Kindheit ist Ihnen am meisten in Erinnerung geblieben und welchen Einfluss hat es auf Sie heute?
- Beschreiben Sie sich selbst nur mithilfe von Farben und Formen.
- Beschreiben Sie, warum die Zeit wie ein Pfeil vergeht, Fruchtfliegen jedoch wie eine Banane?
- Welche Gefühle empfinden Sie, wenn Sie an Ihre Erziehung denken und was löst diese Gefühle bei Ihnen aus?
- Welches historische Ereignis hat Sie am meisten verändert und wo waren Sie, als es geschah?
- Welche der vorherigen Fragen war am schwierigsten zu beantworten und warum?
Geschichte des Turing Tests
Alan Turing gilt als einer der Pioniere der Informatik und der künstlichen Intelligenz. Seinen ersten Vorschlag für den Turing Test machte er 1950 in seinem Aufsatz „ Computing Machinery and Intelligence “. Die Prämisse des Aufsatzes konzentriert sich auf die Frage: „Können Maschinen denken?“ Um diese Frage zu beantworten, schlug Turing einen Test vor, bei dem ein menschlicher Richter ein Gespräch in natürlicher Sprache sowohl mit einem Menschen als auch mit einer Maschine führen würde, ohne zu wissen, wer von beiden wer ist. Wenn der Richter nicht in der Lage war, die Maschine vom Menschen zu unterscheiden, hatte die Maschine Turings Test bestanden.
In den folgenden Jahrzehnten machte das Feld der KI bedeutende Fortschritte und der Turing Test entwickelte sich weiter. Der Loebner-Preis-Turing Test begann 1990 und gilt als eine der bekanntesten Versionen des Turing Tests. Im Jahr 2010 gelang es einem Computer namens Bruce Wilcox, einen Richter bei der Vergabe des Loebner-Preises ein einziges Mal auszutricksen. Seitdem haben andere Maschinen Richter ausgetrickst und den Loebner-Preis gewonnen. Der Loebner-Preis wird seit 2020 nicht mehr verliehen.
Turing Test: Variationen und Alternativen
Seit seiner Einführung hat Turings Test leichte Änderungen erfahren, aber das Ziel ist immer dasselbe geblieben – die Bewertung künstlicher Intelligenz. Obwohl Turing selbst nie die dem Richter zur Verfügung stehende Zeit festgelegt hat, gilt in neueren Versionen des Tests, wie etwa dem Turing Test für den Loebner-Preis, dass die Maschine Turings Test besteht, wenn der Richter nach einer Frage-und-Antwort-Phase von 25 Minuten nicht feststellen kann, in welchem Raum sich ein Mensch und in welchem eine Maschine befindet.
Mit der Weiterentwicklung der künstlichen Intelligenz entwickelten andere Varianten des Turing Tests. Zu den interessanteren Varianten gehören der Reverse Turing Test, der Marcus-Test und der Lovelace-Test 2.0.
Der umgekehrte Turing Test
Beim umgekehrten Turing Test versuchen die Probanden, sich als Computer und nicht als Menschen auszugeben. Ziel ist es, den Computer glauben zu machen, dass er nicht mit einem Menschen interagiert. CAPTCHA- Sicherheitsmaßnahmen, die Sie wahrscheinlich schon einmal beim Anmelden auf einer Website gesehen haben, sind eine Form des umgekehrten Turing Tests, bei dem die Maschine versucht zu beurteilen, ob sie mit einem echten Menschen oder einer anderen Maschine interagiert.
Der Marcus-Test
Beim Marcus-Test, der vom Kognitionswissenschaftler Gary Marcus entwickelt wurde, schauen sich die Probanden Fernsehsendungen oder YouTube-Videos an und beantworten Fragen zum Inhalt. Damit eine Maschine ein laufendes Fernsehprogramm verstehen kann, muss sie die Ereignisse im Laufe der Zeit erfassen. Dadurch wird das menschenähnliche Verständnis einer KI bewertet.
Der Lovelace-Test 2.0
Und schließlich prüft der Lovelace-Test 2.0, benannt nach der Mathematikerin Ada Lovelace, die computergestützte Kreativität. Dieser Test hat in letzter Zeit aufgrund der Fortschritte bei der Text-zu-Bild-Technologie wie MidJourney und OpenAIs DALL · E2 an Bedeutung gewonnen. Beim Lovelace-Test legt der Juror eine Reihe von Einschränkungen fest, die die Maschine seiner Erwartung nach nicht erfüllen kann. Wenn der Juror nicht sagen kann, welche Kreation von einer Maschine stammt, kann er in der nächsten Testrunde eine schwierigere Reihe von Einschränkungen festlegen.
Zwar gibt es Variationen und Alternativen, doch alle Tests weisen ihre eigenen Schwächen auf und keiner ist so bekannt wie der Turing Test.
Was sind die Einschränkungen des Turing Tests?
Obwohl Alan Turing einen einflussreichen Test entwickelte, als er darüber nachdachte, ob Maschinen denken können oder nicht, ist Turings Test kein ausreichender Indikator für künstliche Intelligenz. Turings Test kann nicht nur nicht erklären, ob eine Maschine ihre Eingabe und Ausgabe versteht oder nicht, er berücksichtigt auch weder die Fähigkeit einer Maschine, Muster zu erkennen, noch ihre Fähigkeit, allgemeines Wissen oder Verstand anzuwenden.
Abgesehen von den Beschränkungen des Tests selbst sind viele KI-Forscher der Meinung, dass der Turing Test heute irrelevant ist. Mit den Fortschritten in den Datenwissenschaften und im Cloud-Computing richtet sich der Fokus verstärkt auf die Verarbeitung natürlicher Sprache (NLP) und die Erstellung großer Sprachmodelle wie ChatGPT , BERT und nun Bard . In den letzten zehn Jahren hat sich die NLP-Technologie dramatisch verbessert, sodass Maschinen menschenähnliche Sprache besser verstehen und mit zunehmender Genauigkeit erzeugen können. Vor Kurzem hat Google einen Chatbot namens LaMDA entwickelt , der so gut war, dass einer der daran arbeitenden KI-Forscher glaubte, er besitze Empfindungsvermögen.
Wie wird der Turing Test heute verwendet?
Im letzten Jahrzehnt wurden im Bereich der KI bedeutende Fortschritte erzielt. Diese Fortschritte wurden durch die Entwicklung ausgefeilterer KI- Algorithmen , den Zugriff auf leistungsfähigere Computerhardware sowie den Fokus auf die Verarbeitung natürlicher Sprache und Multitasking-Funktionen ermöglicht. Infolgedessen sind Maschinen zunehmend in der Lage, intelligentes Verhalten zu zeigen, das von dem des Menschen nicht mehr zu unterscheiden ist.
Ob der Turing Test wirklich relevant ist oder nicht, bleibt für KI-Forscher ein heiß diskutiertes Thema. Dennoch sind viele der Meinung, dass KI noch weit davon entfernt ist, eine menschenähnliche allgemeine Intelligenz zu erreichen , und der Turing Test bleibt eine der vielen Möglichkeiten, mit denen Menschen eine Dimension der Fähigkeiten einer KI bewerten können. Wenn Unternehmen wie Google große Sprachmodelle erstellen und die Grenzen der Chatbot-Technologie erweitern, verwenden sie immer noch menschliche Bewerter, die eine Reihe von Fragen stellen, um deren Fähigkeiten zu bestimmen. Auf diese Weise bleibt eine Form von Alan Turings Gedankenexperiment kulturell relevant für die Weiterentwicklung der künstlichen Intelligenz golang.
Häufig gestellte Fragen
Es hat noch nie eine Maschine gegeben, die den Turing Test perfekt bestanden hat. Es gab jedoch einige KI-Maschinen, von denen behauptet wurde, sie hätten den Turing Test bestanden oder die Testrichter getäuscht, darunter ChatGPT, der Eugene Goostman-Chatbot und der ELIZA-Chatbot.
Bei den im Turing Test gestellten Fragen handelt es sich um Fragen, die von einem Menschen beantwortet werden können, wie etwa Fragen zu menschlichen Erfahrungen und Emotionen oder sprachliche Rätsel.
Es gibt keinen offiziellen Fragenkatalog für den Turing Test, aber einige Beispielfragen können sein:
Welches Erlebnis in Ihrer Kindheit ist Ihnen am meisten in Erinnerung geblieben und welchen Einfluss hat es auf Sie heute?
Beschreiben Sie, warum die Zeit wie ein Pfeil vergeht, Fruchtfliegen jedoch wie eine Banane?
Welches historische Ereignis hat Sie am meisten verändert und wo waren Sie, als es geschah?
Variationen des Turing Tests werden noch heute verwendet, um die Forschung im Bereich der künstlichen Intelligenz zu bewerten.