מה אני DRL

לחץ כאן לכל השאלות

b) One of the more challenging use-cases for the Decision Transformer is when the return-to-go becomes negative (particularly when still far from the end of the trajectory).

1
by
מיין לפי

* השאלה נוספה בתאריך: 28-02-2025