מה אני DRL

לחץ כאן לכל השאלות

If we have the optimal value function V* then we are always capable of calculating the optimal Q-function Q* -

1
by
מיין לפי

* השאלה נוספה בתאריך: 28-02-2025