锐拓版权在线

选题分类

您好！
欢迎订阅锐拓版权书讯！我们将及时为您提供最新的可售版权作品信息。请您真实地填写以下表格中的各项信息，以完成免费订阅。

姓名*
公司名称*
电子邮件*
联系电话*
选题分类*	文学小说少儿童书经济管理成功励志人文社科教育教学语言文字科学技术生活艺术
验证码*	换一张

《多智能体强化学习系统的迁移学习》

强化学习人工智能
选题分类：计算机理论
原版语种：英语（可提供图书翻译服务）
出版日期：2021年05月
页数：129页
图书定价：（不详）
开本：190mm×234mm
浏览次数：363
字数：（不详）
作品星级：
内文印刷：单色

您还未登录，请登录后再进行操作。

申请样书样章

您正在通过本网站在线提交出版评估申请。
若您的申请获得通过，您将可以在线对本作品的电子样书进行查看。

申请版权类型	图书出版权数字出版权报刊连载权其他
翻译样章	不需要需要锐拓可有偿为您提供本作品的中文翻译样章，费用为RMB 300 元，金额将从您的账户余额中予以扣除。您的账户余额为RMB 0 元立即在线充值
申请说明

特别提示：
1、一旦提交本申请，则表示您承诺自愿通过成都锐拓传媒广告有限公司申请上述图书的中文版权，并承诺在申请日起18个月内，不会向任何第三方（包括但不限于图书作者、出版方及其他代理商等）申请或联系上述图书的中文简体版权。否则，我公司有权关闭您在本网站的使用权限，且不再与您进行任何业务合作，并有权要求您支付不低于人民币5000元/本的违约金，或将上述违约金直接从您的账户余额中予以扣除。
2、您通过本功能在线申请样书样章而支付的费用仅为样书样章在线查阅的费用，不代表我公司对上述图书的中文版权授权事宜向您作出任何承诺。除非发生我公司无法向您提交样书或样章的情况，否则无论最终是否与您达成中文版权的交易合作，该费用概不退还。

申请翻译样章

您正在通过本网站在线提交翻译样章申请。
若您的申请获得通过，您将可以在线对本作品的翻译样章进行查看。

申请版权类型	图书出版权数字出版权报刊连载权其他
翻译样章	不需要需要锐拓可有偿为您提供本作品的中文翻译样章，费用为RMB 300 元，金额将从您的账户余额中予以扣除。您的账户余额为RMB 0 元立即在线充值
申请说明

内容简介

　　学习解决顺序决策任务是困难的。人类花了数年时间，基本上以随机的方式探索环境，直到他们能够推理、解决困难的任务，并与其他人类合作，朝着一个共同的目标。在这方面，人工智能代理与人类相似。强化学习（RL）是一种通过与环境交互来训练自主主体的著名技术。不幸的是，学习过程具有很高的样本复杂度来推断一个有效的驱动策略，特别是当多个代理同时在环境中执行时。
　　但是，可以利用之前的知识来加速学习并解决更困难的任务。与人类构建技能并通过关联不同的任务来重用它们的方式相同，RL代理可能重用来自以前解决的任务以及与环境中其他代理交换知识的知识。事实上，RL目前解决的所有最具挑战性的任务都依赖于嵌入式知识重用技术，如模仿学习、演示学习和课程学习。
　　这本书调查了多智能体RL中知识重用的文献。作者为知识重用定义了一个最新解决方案的统一分类，并对该领域的最新进展进行了全面的讨论。在这本书中，读者将发现知识可以在多智能体序列决策任务中重用的许多方法的全面讨论，以及每种方法在哪种情况下更有效。作者还提供了他们对该地区目前容易实现的发展成果的看法，以及可能导致突破性发展的仍然悬而未决的大问题。最后，这本书为打算加入这个领域或利用这些技术的研究人员提供了资源，包括会议、期刊和实现工具的列表。

作者介绍

费莉佩·雷诺·达·席尔瓦
　　巴西圣保罗大学博士。他目前是人工智能高级研究所的博士后研究员，在那里他帮助组织了巴西首批人工智能驻留项目之一。自博士学位开始以来，他一直积极研究多智能体RL的知识重用，并坚信RL将在虚拟智能体和物理现实世界之间搭建桥梁。雷诺喜欢在人工智能社区中扮演一些经常被忽视但很重要的角色。他一直是大多数主要AI会议的程序委员会的成员，并组织了多个研讨会，如自适应和学习代理（ALA）和扩大强化学习（SURL）研讨会系列。雷诺大力倡导将少数族裔纳入人工智能社区，并在NeurIPS的人工智能研讨会上多次参与拉丁人的迭代。

安娜·海伦娜·雷丽·科斯塔
　　巴西圣保罗大学教授。她在美国南加州大学获得博士学位，在卡尔斯鲁厄大学研究机器人视觉，并在卡内基梅隆大学担任客座研究员，在移动机器人团队中研究学习、规划和执行的整合。她是数据科学中心（Data Science Center, C2D）主任，该中心是USP和Itaú-Unibanco银行之间的合作伙伴，也是USP、IBM和FAPESP之间的合作伙伴人工智能中心（Center for Artificial Intelligence, C4AI）的成员。她的科学贡献在于人工智能和机器学习，特别是RL。她的长期研究目标是创造自主的、道德的、强大的代理，能够学会在复杂和动态的环境中相互作用，以人类的福祉为目标。