Think, Solve, and Learn למדת 0 מתוך 50

שים לב! - לא תוכל לראות התקדמות למידה ללא התחברות (תמיד תשאר על 0%)
לחץ פה להתחברות מהירה

shuffle help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

In reinforcement learning, which component is responsible for updating the policy?

(20 נק') - שאלה #171117

2. Which of the following is a major challenge in reinforcement learning compared to supervised learning?

(20 נק') - שאלה #171118

3. Why do DQNs use experience replay?

(20 נק') - שאלה #171119

4. Policy gradients are particularly useful in

(20 נק') - שאלה #171120

5. Which of the following statements about DAgger is correct?

(20 נק') - שאלה #171121