מה אני DRL

לחץ כאן לכל השאלות

The two Q-functions are trained on the same experiences (i.e. samples), but vary in their parameters

1
by
מיין לפי

* השאלה נוספה בתאריך: 26-02-2025