מה אני DRL

לחץ כאן לכל השאלות

a. For a good unbiased estimator, we could use the average of the value-function for all the states in our state space

1
sentiment_very_satisfied
by
מיין לפי

* השאלה נוספה בתאריך: 28-02-2025