《 注释分析的统计方法 》
- 分析数据
- 选题分类:计算机理论 数据库
- 原版语种:英语(可提供图书翻译服务)
- 出版日期:2022年01月
- 页数:217页
- 图书定价:(不详)
- 开本:190mm×234mm
- 浏览次数:209
- 字数:(不详)
- 作品星级:
- 内文印刷:(不详)
申请样书样章
您正在通过本网站在线提交出版评估申请。
若您的申请获得通过,您将可以在线对本作品的电子样书进行查看。
特别提示:
1、一旦提交本申请,则表示您承诺自愿通过成都锐拓传媒广告有限公司申请上述图书的中文版权,并承诺在申请日起18个月内,不会向任何第三方(包括但不限于图书作者、出版方及其他代理商等)申请或联系上述图书的中文简体版权。否则,我公司有权关闭您在本网站的使用权限,且不再与您进行任何业务合作,并有权要求您支付不低于人民币5000元/本的违约金,或将上述违约金直接从您的账户余额中予以扣除。
2、您通过本功能在线申请样书样章而支付的费用仅为样书样章在线查阅的费用,不代表我公司对上述图书的中文版权授权事宜向您作出任何承诺。除非发生我公司无法向您提交样书或样章的情况,否则无论最终是否与您达成中文版权的交易合作,该费用概不退还。
申请翻译样章
您正在通过本网站在线提交翻译样章申请。
若您的申请获得通过,您将可以在线对本作品的翻译样章进行查看。
特别提示:
1、一旦提交本申请,则表示您承诺自愿通过成都锐拓传媒广告有限公司申请上述图书的中文版权,并承诺在申请日起18个月内,不会向任何第三方(包括但不限于图书作者、出版方及其他代理商等)申请或联系上述图书的中文简体版权。否则,我公司有权关闭您在本网站的使用权限,且不再与您进行任何业务合作,并有权要求您支付不低于人民币5000元/本的违约金,或将上述违约金直接从您的账户余额中予以扣除。
2、您通过本功能在线申请样书样章而支付的费用仅为样书样章在线查阅的费用,不代表我公司对上述图书的中文版权授权事宜向您作出任何承诺。除非发生我公司无法向您提交样书或样章的情况,否则无论最终是否与您达成中文版权的交易合作,该费用概不退还。
内容简介
早期的人工智能数据集是在特别的基础上创建的,以解决特定的问题。随着创建更大、更可重用的数据集,需要更多的投资,因此需要更系统的方法来创建数据集,以确保更高的质量。采用了一系列的统计方法,通常但不完全来自医学科学,以确保所使用的标签不是主观的,或在编码员提供的不同标签中进行选择。这种方法现在广泛使用。本书旨在对这些支持注释实践的统计方法中最广泛使用的方法进行调查。
据作者所知,这是第一本尝试广泛使用这两种方法的书。第一类方法涉及标签方案的制定,特别是确保这些方案能够使编码人员之间达成充分的一致。第二类包括在方案达成一致后用于分析编码器输出的方法,特别是在编码器提供的标签中确定最可能的项目标签。
这本书的重点主要是自然语言处理,这是人工智能领域,致力于语言解释和生产模型的开发,
但这里讨论的许多方法也适用于人工智能的其他领域,或者实际上也适用于数据科学的其他领域。
作者介绍
2017年,西尔维·潘恩凭借一篇主题模型的论文获得了埃塞克斯大学的博士学位。从那以后,他一直在伦敦玛丽女王大学。他的研究集中在注释模型、概率模型和神经模型,以创建资源和更有效地训练机器学习模型。他的模型已经被用于创建短语侦探相关语料库,这是最大的众包NLP语料库之一,使用短语侦探游戏-有目的语料库创建。
罗恩·阿特斯泰
于2002年获得罗格斯大学语言学博士学位,曾在以色列理工学院和埃塞克斯大学担任职务,目前是南加州大学创新技术研究所的研究科学家。他目前的研究主要集中在人机交互语言数据的收集、注释和管理、语料库分析和对话系统的评估;他发表了理论和计算语言学、会话对话系统、人和机器人交互等方面的著作。