Recommended expert

David Silver

Forscher (AlphaGo Zero)

David Silver
Chemnitz, Vereinigtes Königreich

Erfahrungen

Okt. 2017 - Okt. 2017
1 Monat
London, Vereinigtes Königreich

Forscher (AlphaGo Zero)

DeepMind

  • Entwickelte einen Reinforcement-Learning-Algorithmus, der eine übermenschliche Spielstärke im Go erreicht, ausgehend von zufälligem Spielen ohne menschliche Daten, Anleitung oder Domänenwissen über die Grundregeln hinaus.

  • Erzielt eine 100-0-Bilanz gegen die AlphaGo-Version, die den Weltmeister geschlagen hatte.

  • Ersetzte getrennte Policy- und Value-Netzwerke durch eine einzige neuronale Netzwerkarchitektur mit vielen Residualblöcken aus Konvolutionsschichten mit Batch-Normalisierung und Rectifier-Nonlinearitäten.

  • Implementierte eine vereinfachte Baumsuche, die auf ein einziges neuronales Netzwerk für Positionsbewertung und Zugauswahl setzt, ohne Monte-Carlo-Rollouts durchzuführen.

  • Integrierte eine vorausschauende Suche in die Trainingsschleife, um schnelle Verbesserungen und stabiles Lernen zu erreichen.

  • Entdeckte grundlegende Elemente menschlichen Go-Wissens neu, darunter Joseki (Eckenabfolgen), Fuseki (Eröffnungsstrategien) und Leben-und-Tod-Konzepte aus ersten Prinzipien.

  • Optimierte das System so, dass es auf einer einzelnen Maschine mit 4 Tensor Processing Units (TPUs) in der Google Cloud läuft.

Jan. 2017 - Jan. 2017
1 Monat
London, Vereinigtes Königreich

Forscher (AlphaGo Master)

DeepMind

  • Besiegte im Januar 2017 in Online-Partien die stärksten menschlichen Profispieler mit 60-0.

  • Nutzte eine spezialisierte neuronale Netzwerkarchitektur und einen Reinforcement-Learning-Algorithmus gemäß dem AlphaGo Zero-Framework.

  • Integrierte handgefertigte Merkmale und Rollouts in den Suchalgorithmus.

  • Initialisierte das Training durch überwachtes Lernen mit Daten menschlicher Experten.

März 2016 - März 2016
1 Monat
London, Vereinigtes Königreich

Forscher (AlphaGo Lee)

DeepMind

  • Besiegte im März 2016 Lee Sedol, den Gewinner von 18 internationalen Titeln.

  • Implementierte ein verteiltes System über mehrere Maschinen und setzte dabei 48 Tensor Processing Units (TPUs) ein, um neuronale Netze während der Suche zu evaluieren.

  • Trainierte das Value-Netzwerk mit Ergebnissen schneller Selbstspiel-Partien von AlphaGo.

  • Verwendete eine größere Policy- und Value-Netzwerkarchitektur im Vergleich zu früheren Versionen mit 12 Konvolutionsschichten.

Okt. 2015 - Okt. 2015
1 Monat
London, Vereinigtes Königreich

Forscher (AlphaGo Fan)

DeepMind

  • Besiegte im Oktober 2015 den Europameister Fan Hui.

  • Entwickelte und nutzte zwei tiefe neuronale Netze: ein Policy-Netzwerk, das Zugwahrscheinlichkeiten angibt, und ein Value-Netzwerk, das Positionsbewertungen liefert.

  • Trainierte das Policy-Netzwerk zunächst durch überwachtes Lernen, um die Züge menschlicher Experten vorherzusagen, und verfeinerte es anschließend mit Policy-Gradient-Reinforcement-Learning.

  • Trainierte das Value-Netzwerk darauf, den Gewinner von vom Policy-Netzwerk gegen sich selbst gespielten Partien vorherzusagen.

  • Kombinierte neuronale Netze mit einer Monte-Carlo-Tree-Search (MCTS), um eine ausgefeilte Vorausblicksuche zu bieten.

Forscher

Google Inc.

  • Ioannis Antonoglou: Veröffentlichte umfangreiche Forschung in KI und maschinellem Lernen, trug mit 36 Publikationen bei und sammelte über 10.375 Zitationen.

  • Yutian Chen: Veröffentlichte fortgeschrittene Forschung im maschinellen Lernen, trug mit 24 Publikationen bei und sammelte über 77.831 Zitationen.

Forscher

Microsoft

  • Thore Graepel: Hat hochwirksame Forschung im Bereich der Künstlichen Intelligenz veröffentlicht und zu 206 Publikationen mit über 33.474 Zitierungen beigetragen.

Sprachen

Englisch
Muttersprache
Chinesisch
Verhandlungssicher

Profil

Erstellt
Sie suchen Freelancer?Passende Kandidaten in Sekunden!
FRATCH GPT testen
Weitere Aktionen

Frequently asked questions

Sie haben Fragen? Hier finden Sie weitere Informationen.

Wo ist David ansässig?

David ist in Chemnitz, Vereinigtes Königreich ansässig.

Welche Sprachen spricht David?

David spricht folgende Sprachen: Englisch (Muttersprache), Chinesisch (Verhandlungssicher).

Wie viele Jahre Erfahrung hat David?

David hat mindestens 0 Jahre Erfahrung. In dieser Zeit hat David in mindestens 4 verschiedenen Rollen und für 1 Firma gearbeitet. Die durchschnittliche Dauer der einzelnen Projekte beträgt 0 Monate. Beachten Sie, dass David möglicherweise nicht alle Erfahrungen geteilt hat und tatsächlich mehr Erfahrung hat.

Für welche Rollen wäre David am besten geeignet?

Basierend auf der jüngsten Erfahrung wäre David gut geeignet für Rollen wie: Forscher (AlphaGo Zero), Forscher (AlphaGo Master), Forscher (AlphaGo Lee).

Was ist das neueste Projekt von David?

Die neueste Position von David ist Forscher (AlphaGo Zero) bei DeepMind.

In welchen Industrien hat David die meiste Erfahrung?

David hat die meiste Erfahrung in Industrien wie Informationstechnologie.

In welchen Bereichen hat David die meiste Erfahrung?

David hat die meiste Erfahrung in Bereichen wie Informationstechnologie, Forschung und Entwicklung und Produktentwicklung.

Wie ist die Verfügbarkeit von David?

David ist sofort verfügbar für passende Projekte.

Wie hoch ist der Stundensatz von David?

Der Stundensatz von David hängt von den spezifischen Projektanforderungen ab. Bitte verwenden Sie die Meet-Schaltfläche im Profil, um ein Meeting zu planen und die Details zu besprechen.

Wie kann man David beauftragen?

Um David zu beauftragen, klicken Sie auf die Meet-Schaltfläche im Profil, um ein Meeting anzufragen und Ihre Projektanforderungen zu besprechen.

Durchschnittlicher Tagessatz für ähnliche Positionen

Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.

1000
750
500
250
⌀ Markt: 790-950 €
Die angegebenen Tagessätze entsprechen der typischen Marktspanne für Freiberufler in dieser Position, basierend auf aktuellen Projekten auf unserer Plattform.
Die tatsächlichen Tagessätze können je nach Dienstalter, Erfahrung, Fachkenntnissen, Projektkomplexität und Auftragsdauer variieren.