Nach dem Schach und vor unserem köstlichen Gehirn kommt AI für soziale Strategiespiele – und es gewinnt gewinnt
Seit dem Schachmeister von Chess Computer Deep Blue, der den Weltmeister Garry Kasparov im Jahr 1997 besiegte, hat die künstliche Intelligenz in einer Handvoll widersprüchlicher Spiele zunehmend über den Menschen beeinflusst, in denen die menschliche Interaktion eine begrenzte Rolle spielt. Jetzt hat eine Gruppe von Forschern jedoch eine neue KI enthüllt, die versucht, den Pool von Spielen zu erweitern, bei dem ein Computer Sie schlagen kann.
In einem Papier (eröffnet in New Tab), das diese Woche veröffentlicht wurde Dialog mit den anderen während einer Verhandlungsperiode, bevor eine Maßnahme ergriffen wird. Diese Diskussionsphase unterscheidet Ciceros Bemühungen von anderen KI.
In der Zeitung heißt es, dass fast alle früheren AI-Durchbrüche in Zwei-Spieler-Zero-Sum-Spiele stattgefunden haben, bei denen der andere Spieler einen Vorteil für sich selbst nimmt. In diesen Spielen-Schäden, Starcraft, Go und Poker-kann die KI eine optimale Strategie lernen, indem sie in einem Muster, das als Selbsteinstellung bekannt ist, gegen sich selbst spielt. Schließlich wird es einen Ansatz finden, der in einem ausgewogenen Spiel nicht geschlagen werden kann. In diesen Beispielen ist die Komplexität des Spiels selbst nicht wichtig. Was zählt, ist, dass Kommunikation kein zentraler Spielmechaniker ist und dass jede Aktion bestrebt ist, einen anderen Spieler wieder in ihr Ziel zu setzen.
Das gilt nicht für Diplomatie, ein Spiel, in dem das Gespräch zwischen den Spielern wichtig ist (wenn auch nicht ganz wichtig), und bei dem einen Gegner nicht unbedingt Schaden zufügt. Hier spielte das Selbstspiel eine nicht interpretierbare Sprache. Das war ein wichtiges Hindernis für die Überwindung, da die Anonymität der Schlüssel zu einem fairen Experiment war. Die Kommunikation zwischen den Spielern musste im Zustand des Spiels oder im bereits stattfindenden Ereignisse beruhen, und wenn Cicero ausrutschte, bestand die Wahrscheinlichkeit, dass sie aufgrund seiner Unfähigkeit, seinen Fehler zu erklären, herausgefunden werden würde.
Noch wichtiger war jedoch die Fähigkeit, Vertrauen mit Mitspielern aufzubauen. Theoretisch wäre dieses Konzept Cicero fremd, aber um erfolgreich zu sein, müsste es die Fähigkeit zur Vermittlung der Überzeugungen, Ziele und Absichten anderer sowie die Fähigkeit, durch den Dialog zu überzeugen und Beziehungen aufzubauen zu etablieren.
Um Cicero zu etablieren, nahmen die Forscher einen Datensatz mit mehr als 40.000 dialogbetriebenen Diplomatiespielen aus einer Online-Version des Spiels. Anschließend wurde ein Basisdialogmodell auf den Chat-Protokollen der Diplomatie geschult und dann geschult, um Nachrichten basierend auf einer Reihe von Spieldaten vorherzusagen. Schließlich wurde Cicero darin geschult, die Informationen in einer Nachricht zu ausbeuten, wenn sie sich für seine nächste Aktion entschied, und gleichzeitig der Meinung war, was andere Spieler versuchen könnten.
Schließlich wurde Cicero anonym in eine Online-Liga eingetragen, die von August bis Oktober 2022 lief Fünf Spiele. Insgesamt war Cicero der Turniersieger mit einer durchschnittlichen Punktzahl mehr als doppelt so hoch wie bei einigen seiner 82 Gegner.
Es war vielleicht keine vollständige Vernichtung gewesen, aber es war ein Turnier, das für eine KI eine bedeutende Grundlage für ähnliche, zukünftige Bemühungen legte. Im Moment könnte es auf Diplomatie beschränkt sein, aber es fällt mir auf, dass eine ähnliche Technologie wie Cicero eines Tages zu Spielen wie Siedlern von Catan oder sogar Social-Ab-Videospielen wie Town of Salem oder unter uns sein könnte. Jetzt wäre Sus.