David Silver
Forscher (AlphaGo Zero)
Erfahrungen
Forscher (AlphaGo Zero)
DeepMind
Entwickelte einen Reinforcement-Learning-Algorithmus, der eine übermenschliche Spielstärke im Go erreicht, ausgehend von zufälligem Spielen ohne menschliche Daten, Anleitung oder Domänenwissen über die Grundregeln hinaus.
Erzielt eine 100-0-Bilanz gegen die AlphaGo-Version, die den Weltmeister geschlagen hatte.
Ersetzte getrennte Policy- und Value-Netzwerke durch eine einzige neuronale Netzwerkarchitektur mit vielen Residualblöcken aus Konvolutionsschichten mit Batch-Normalisierung und Rectifier-Nonlinearitäten.
Implementierte eine vereinfachte Baumsuche, die auf ein einziges neuronales Netzwerk für Positionsbewertung und Zugauswahl setzt, ohne Monte-Carlo-Rollouts durchzuführen.
Integrierte eine vorausschauende Suche in die Trainingsschleife, um schnelle Verbesserungen und stabiles Lernen zu erreichen.
Entdeckte grundlegende Elemente menschlichen Go-Wissens neu, darunter Joseki (Eckenabfolgen), Fuseki (Eröffnungsstrategien) und Leben-und-Tod-Konzepte aus ersten Prinzipien.
Optimierte das System so, dass es auf einer einzelnen Maschine mit 4 Tensor Processing Units (TPUs) in der Google Cloud läuft.
Forscher (AlphaGo Master)
DeepMind
Besiegte im Januar 2017 in Online-Partien die stärksten menschlichen Profispieler mit 60-0.
Nutzte eine spezialisierte neuronale Netzwerkarchitektur und einen Reinforcement-Learning-Algorithmus gemäß dem AlphaGo Zero-Framework.
Integrierte handgefertigte Merkmale und Rollouts in den Suchalgorithmus.
Initialisierte das Training durch überwachtes Lernen mit Daten menschlicher Experten.
Forscher (AlphaGo Lee)
DeepMind
Besiegte im März 2016 Lee Sedol, den Gewinner von 18 internationalen Titeln.
Implementierte ein verteiltes System über mehrere Maschinen und setzte dabei 48 Tensor Processing Units (TPUs) ein, um neuronale Netze während der Suche zu evaluieren.
Trainierte das Value-Netzwerk mit Ergebnissen schneller Selbstspiel-Partien von AlphaGo.
Verwendete eine größere Policy- und Value-Netzwerkarchitektur im Vergleich zu früheren Versionen mit 12 Konvolutionsschichten.
Forscher (AlphaGo Fan)
DeepMind
Besiegte im Oktober 2015 den Europameister Fan Hui.
Entwickelte und nutzte zwei tiefe neuronale Netze: ein Policy-Netzwerk, das Zugwahrscheinlichkeiten angibt, und ein Value-Netzwerk, das Positionsbewertungen liefert.
Trainierte das Policy-Netzwerk zunächst durch überwachtes Lernen, um die Züge menschlicher Experten vorherzusagen, und verfeinerte es anschließend mit Policy-Gradient-Reinforcement-Learning.
Trainierte das Value-Netzwerk darauf, den Gewinner von vom Policy-Netzwerk gegen sich selbst gespielten Partien vorherzusagen.
Kombinierte neuronale Netze mit einer Monte-Carlo-Tree-Search (MCTS), um eine ausgefeilte Vorausblicksuche zu bieten.
Forscher
Google Inc.
Ioannis Antonoglou: Veröffentlichte umfangreiche Forschung in KI und maschinellem Lernen, trug mit 36 Publikationen bei und sammelte über 10.375 Zitationen.
Yutian Chen: Veröffentlichte fortgeschrittene Forschung im maschinellen Lernen, trug mit 24 Publikationen bei und sammelte über 77.831 Zitationen.
Forscher
Microsoft
- Thore Graepel: Hat hochwirksame Forschung im Bereich der Künstlichen Intelligenz veröffentlicht und zu 206 Publikationen mit über 33.474 Zitierungen beigetragen.
Sprachen
Profil
Frequently asked questions
Sie haben Fragen? Hier finden Sie weitere Informationen.
Wo ist David ansässig?
Welche Sprachen spricht David?
Wie viele Jahre Erfahrung hat David?
Für welche Rollen wäre David am besten geeignet?
Was ist das neueste Projekt von David?
In welchen Industrien hat David die meiste Erfahrung?
In welchen Bereichen hat David die meiste Erfahrung?
Wie ist die Verfügbarkeit von David?
Wie hoch ist der Stundensatz von David?
Wie kann man David beauftragen?
Durchschnittlicher Tagessatz für ähnliche Positionen
Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.
Ähnliche Freelancer
Entdecken Sie andere Experten mit ähnlichen Qualifikationen und Erfahrungen
Experten, die kürzlich an ähnlichen Projekten gearbeitet haben
Freelancer mit praktischer Erfahrung in vergleichbaren Projekten als Forscher (AlphaGo Zero)
Freelancer in der Nähe
Fachkräfte, die in oder in der Nähe von Chemnitz, Vereinigtes Königreich arbeiten