Es sind ja eine ganze Menge separater KI-"Persönlichkeiten", die gegeneinander trainieren und von denen jeweils die stärksten ausgewählt wurden, um die Spiele zu spielen. Und so ein neuronales Netzwerk schert sich nicht um Effizienz, sondern nur um das Maximieren der Reward Function, also ihrer Aufgabe (also: Gewinne deine Spiele, und für einige KI-Persönlichkeiten noch Bonusziele wie "Gewinne mit einer bestimmten Einheit"). Solange ein Verhalten der Reward Function nicht entgegensteht, stehen die Chancen gut, dass es erhalten bleibt. So wie der menschliche Blinddarm trotz potentiell lebensbedrohlicher Blinddarmentzündungen nach vielen Generationen nicht verschwunden ist, oder wie wir Energie für jämmerliche Körperbehaarung verschwenden, dass seiner ursprünglichen Funktion gar nicht mehr nachkommen kann, oder Weisheitszähne, die uns im Grunde nur Probleme bereiten.
Warum gibt es so ein Projekt nicht für Civ6 oder EU IV?
Schon klar, aber bei 200 Jahren Spielzeit würde es mich wundern, wenn nicht irgendwann die Agents ohne diese Klicks sich durchsetzen. Auch ohne künstliche Begrenzung wie in den Showmatches sind der KI ja Grenzen für die Anzahl an Klicks gesetzt.
Wenn beim Training die APM begrenzt waren, sind überflüssige Klicks sicher rausgeflogen. Außer, es kommt halt garnicht so sehr auf Effizienz an.
Bezüglich der Idlezeiten war zwischendurch eine Grafik eingeblendet, ich glaub beim zweiten TLO-Spiel, wo die KI irgendwas zweistelliges hatte und TLO vierstellig. Keine Ahnung, in welcher Einheit das war
So wie ich das verstanden habe, gab es btw. keine "Bonusziele", die seltsamen Strategien haben sich von allein (oder inspiriert durch Bronze-League-Cheeses) gebildet.
Nein, sie haben auf dem Stream gesagt, dass z.B. die KI, die in dem einen Spiel richtig viele Disruptoren gebaut hat, das in jedem Spiel macht, weil ihre Aufgabe ist, Spiele zu gewinnen und einen Disruptor dabei zu bauen - und am Ende kommt dann sowas wie dieses extrem seltsame Spiel dabei heraus.
In dem Spiel, wo Mana gewonnen hat, hat die KI mehrere Oracle relativ sinnlos verloren. Ich vermute das hing damit zusammen, dass sie auf einem anderen Screen war und die APM-zu begrenzt waren um die Oracles rechtzeitig zu retten.
Meine KI für "Remnants of the Precurors" (Master of Orion Remake) => https://github.com/Xilmi/Rotp-Fusion/releases
Meine KI für "UFO: Enemy Unknown" => https://github.com/Xilmi/OpenXcom/releases
EU4 und Civ sind vermutlich auch noch zu komplex und das Training würde um einiges länger dauern. Eine Partie Starcraft dauert doch maximal 30 Minuten, eine Partie EU4 dagegen 30+ Stunden. Ich könnte mir auch vorstellen, dass der Zufallsaspekt in EU4 auch nicht wirklich gut ist für den Lernprozess.
Wow! Hab ich nicht kürzlich erst gelesen, daß Starcraft noch nicht so gut vom Computer beherrscht wird? Die Meldung überrascht mich jetzt, auch wenn natürlich klar ist, daß sie früher oder später kommen musste.
Ich nehme an, daß man die Spiele irgendwo als Video findet... werd ich mir sicher mal anschauen. Meine SC2 Fähigkeiten sind leider max Silber-Niveau gewesen, aber ich hab ne Weile gerne zugeschaut. (damals waren TLO und MaNa auch noch (mit an der) Spitze, keine Ahnung, wer da jetzt so am Drücker ist)
Kann ich mir nicht vorstellen. Bei Starcraft gibt es ja wesentlich mehr Freiheitsgrade durch die extrem feine Körnung zeitlicher Abläufe (-->Echtzeit): kommen Deine Marines 5 Sekunden zu spät, haben Mutalisken schon 20 Arbeiter gekillt. Kommen sie 5 Sekunden früher, muss dagegen der Angreifer entscheiden, ob er abzieht oder bleibt, um Schaden anzurichten, und das in kürzester Zeit. Glaube nicht, dass ein rundenbasiertes Spiel nach der "Lösung" von Go noch ein großes Problem darstellt.
Nethack: Ein Roguelike mit Spieltiefe ohne Ende!
PB87: Alexander im letzten (?!) Civ4-PB
PB82: Ludwig XIV. im Wunderwahn
PB81: Mali!
Story im PB 80 (mit Keine Andeutung; ausgestiegen)
Story im PB 78 (mit Keine Andeutung; vernichtet)
SP: Unsterbliches Äthiopien im Panzerwahn
SP: Kyros der Perser, Unsterblich, Weltraumsieg!
Denke ich auch. Ganz zu schweigen dass die KI auf einem Supercomputer trainiert wurde. D.h. sie könnte Unmengen an Spielen absolvieren. Und anders als der Mensch würden die alle bis zum Ende gehen. Im Endgame hätte sie bei EU unendlich mehr Erfahrung als jeder Mensch
Das ist alles, was wir tun können: immer wieder von neuem anfangen, immer und immer wieder. (Thornton Wilder)
In allen Teilen des Spiels hat sie mehr Erfahrung als jeder Mensch, wenn sie umgerechnet 200 Jahre Erfahrung innerhalb wenigerWoche gesammelt haben.