《 文本数据管理与分析:信息检索与文本挖掘实用导论 》
- 文本数据管理信息检索文本挖掘自然语言文本数据非结构化文本处理统计学方法启发式方法跨语言分析跨主题分析参考教材
- #实用导论 #理论与实践结合 #高年级本科生教材 #跨领域适用 #行业趋势贴合 #非结构化数据处理 #数据科学参考
- 选题分类:计算机理论 程序设计 管理信息系统
- 原版语种:英语(可提供图书翻译服务)
- 原出版地:美国
- 出版日期:
- 页数:530页
- 图书定价:99.95 美元
- 开本:(不详)
- 内文印刷:(不详)
- 字数:(不详)
申请样书样章
您正在通过本网站在线提交出版评估申请。
若您的申请获得通过,您将可以在线对本作品的电子样书进行查看。
特别提示:
1、一旦提交本申请,则表示您承诺自愿通过成都锐拓传媒广告有限公司申请上述图书的中文版权,并承诺在申请日起18个月内,不会向任何第三方(包括但不限于图书作者、出版方及其他代理商等)申请或联系上述图书的中文简体版权。否则,我公司有权关闭您在本网站的使用权限,且不再与您进行任何业务合作,并有权要求您支付不低于人民币5000元/本的违约金,或将上述违约金直接从您的账户余额中予以扣除。
2、您通过本功能在线申请样书样章而支付的费用仅为样书样章在线查阅的费用,不代表我公司对上述图书的中文版权授权事宜向您作出任何承诺。除非发生我公司无法向您提交样书或样章的情况,否则无论最终是否与您达成中文版权的交易合作,该费用概不退还。
申请翻译样章
您正在通过本网站在线提交翻译样章申请。
若您的申请获得通过,您将可以在线对本作品的翻译样章进行查看。
特别提示:
1、一旦提交本申请,则表示您承诺自愿通过成都锐拓传媒广告有限公司申请上述图书的中文版权,并承诺在申请日起18个月内,不会向任何第三方(包括但不限于图书作者、出版方及其他代理商等)申请或联系上述图书的中文简体版权。否则,我公司有权关闭您在本网站的使用权限,且不再与您进行任何业务合作,并有权要求您支付不低于人民币5000元/本的违约金,或将上述违约金直接从您的账户余额中予以扣除。
2、您通过本功能在线申请样书样章而支付的费用仅为样书样章在线查阅的费用,不代表我公司对上述图书的中文版权授权事宜向您作出任何承诺。除非发生我公司无法向您提交样书或样章的情况,否则无论最终是否与您达成中文版权的交易合作,该费用概不退还。
推荐人
——费尔南多·贝尔萨尔
版权推荐
★聚焦文本数据管理与分析核心需求,系统讲解统计学与启发式处理方法,技术具备跨语言、跨主题的普适性,可应对海量非结构化文本处理难题。
★内容贴合当下文本数据爆发的行业趋势,为社交媒体、企业文档、科研文献等多场景的文本分析工作,提供切实可行的技术路径。
内容简介
与计算机系统或传感器生成的数据不同,文本数据通常由人类直接创作,承载着丰富的语义内涵。正因如此,文本数据除了能承载各类我们需要编码记录的知识外,在挖掘人类观点与偏好相关信息方面,也具备极高的价值。
结构化数据遵循清晰定义的模式,因此相对容易被计算机处理;与之不同的是,文本数据的结构并不明确,需要借助计算机处理,才能解读其中蕴含的内容。当前的自然语言处理技术,尚未发展到能让计算机精准理解自然语言文本的水平,但在过去数十年间,学界和业界已开发出大量基于统计学与启发式方法的文本数据分析管理技术。这些技术通常具备极强的稳健性,可应用于任意自然语言、任意主题的文本数据的分析与管理工作。
作者介绍
伊利诺伊大学厄巴纳-香槟分校计算机科学教授、威利特学院学者,同时隶属于该校图书馆与信息科学研究生院、基因组生物学研究所及统计学系。他于1990年获得南京大学计算机科学博士学位,2002年获得卡内基梅隆大学语言与信息技术博士学位。1997年至2000年,他任职于透视公司,先后担任研究员、高级研究员。他的研究方向包括信息检索、文本挖掘、自然语言处理、机器学习、生物医学与健康信息学、智能教育信息系统。他已在各大主流学术会议与期刊上发表论文200余篇。他曾担任《信息处理与管理》《美国计算机协会信息系统汇刊》的副主编,以及《信息检索期刊》编委会成员。他曾担任2004年美国计算机协会信息与知识管理大会、2007年北美计算语言学协会人类语言技术大会、2009年美国计算机协会信息检索大会、2014年欧洲信息检索大会、2015年信息检索理论大会及2015年国际万维网大会的程序联合主席,同时担任2016年美国计算机协会信息与知识管理大会的大会联合主席。他是美国计算机协会杰出科学家,曾斩获多项大奖,包括2004年美国计算机协会信息检索大会最佳论文奖、2014年美国计算机协会信息检索大会经典论文奖、艾尔弗雷德·P·斯隆研究奖学金、IBM 教师奖、惠普创新研究计划奖、微软超越搜索研究奖,以及美国青年科学家与工程师总统奖。
肖恩·马松
伊利诺伊大学厄巴纳 - 香槟分校计算机科学博士研究生,他的理学学士与理学硕士学位均毕业于该校。他是元数据公司的联合创始人,其所有研究工作均基于该公司的技术开展。他曾主讲《数据结构与编程原理》《文本信息系统》《文本挖掘研讨会》等课程。他入选2014年伊利诺伊大学优秀教师榜单,曾荣获杰出助教奖与伊利诺伊大学计算机科学学院杰出研究项目奖。他曾在尚佩恩跳跃实验室、伊利诺伊大学厄巴纳 - 香槟分校的数据与信息系统研讨会、大数据导论课程及助教研讨会上发表演讲。他的研究方向包括信息检索、自然语言处理及教育领域的文本挖掘应用。
★聚焦文本数据管理与分析核心需求,系统讲解统计学与启发式处理方法,技术具备跨语言、跨主题的普适性,可应对海量非结构化文本处理难题。
★内容贴合当下文本数据爆发的行业趋势,为社交媒体、企业文档、科研文献等多场景的文本分析工作,提供切实可行的技术路径。
