第4四版 平装 版 当当网 彼得·诺维格 现代方法 斯图尔特·罗素 机器学习计算机控制仿真与人工智能领域deepseek编程书籍 人工智能
折后价 ¥ 108
基于策略迭代方法求解网格世界 基本设计 代码 机策略梯度与REINFORCE算法 方法 深度强化学习 算法中减少方差 理解强化学习
所 在 地:北京
累计销量:0 件
店铺掌柜: 书香图书专营店
¥73.3 ¥89.00
商品详情
