畅销榜

订阅榜

Python数据分析与挖掘实战

Python数据分析与挖掘实战

作者:
张良均
         
¥25.00

本书从实践出发,结合大量数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出地介绍数据挖掘建模过程中的有关任务:数据探索、数据预处理、分类与预测、聚类分析、时序预测、关联规则挖掘、智能推荐和偏差检测等。因此,图书的编排以解决某个应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建。在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。

白话大数据与机器学习

白话大数据与机器学习

作者:
高扬
         
¥25.00

从行为脉络来看,本书基本上是从数据统计、数据指标理解、数据模型、聚类/分类与机器学习、数据应用、大数据框架补充知识,以及扩展讨论这样的角度来层层深入完成的。这种方式会给读者比较好的带入感,让大家——尤其是不擅长数学的读者降低对大数据与机器学习算法的恐惧感。如果读者朋友对排列组合、统计分布这些基础知识比较了解,完全可以考虑跳过这些部分直接去读后面更感兴趣的内容。为了调节阅读气氛,我们还尝试加入了一些漫画插图。为了让读者朋友能够更快地进行实践,我们几乎在每一个算法讲解后都配有Python或者SQL语言的实现部分。相信这些能够帮助大家更快、更轻松地阅读本书。

Hadoop大数据分析与挖掘实战

Hadoop大数据分析与挖掘实战

作者:
樊哲,张良均,李成华,刘丽君
         
¥25.00

本书作者从实践出发,结合大量大数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出介绍大数据挖掘项目中针对数据分析的各个流程:数据探索、数据预处理、分类与预测、聚类分析、关联规则挖掘、智能推荐等。因此,图书的编排以解决某个大数据应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述针对这个目标使用的大数据挖掘分析方法与过程,最后完成模型构建,在介绍建模过程中会针对每个大数据项目的特点进行分析,同时提供上机实验,把相关的建模操作提供给读者。

Spark大数据分析实战

Spark大数据分析实战

作者:
倪亚宇,高彦杰
         
¥25.00

这是一本根据应用场景讲解如何通过Spark进行大数据分析与应用构建的著作,以实战为导向。作者结合典型应用场景,抽象出通用与简化后的模型,以便于读者能举一反三,直接应用。本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。在每个场景中,首先是对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法与应用,最后结合其他开源系统或工具构建更为丰富的数据分析流水线。

Redis开发与运维

Redis开发与运维

作者:
付磊;张益军
         
¥30.00

本书全面讲解Redis基本功能及其应用,并结合线上开发与运维中的实际案例,深入分析并总结了实际工作中遇到的“陷阱”,以及背后的原因,包含大规模集群开发与管理的场景、应用案例与开发技巧,为高效开发运维提供了大量实际经验和建议。本书不要求读者有任何Redis使用经验,对入门与进阶DevOps的开发者提供有价值的帮助。主要内容包括:Redis的安装配置、API、各种高效功能、客户端、持久化、复制、高可用、内存、哨兵、集群、缓存设计等,Redis高可用集群解决方案,Redis设计和使用中的问题,最后提供了一个开源工具:Redis监控运维云平台CacheCloud。

麦肯锡大数据指南

麦肯锡大数据指南

作者:
【美】麦肯锡
         
¥25.00

“大数据”一词如日中天,热闹非凡,但行业应用、最佳实践却乏善可陈。这本小册子,字数虽然不多,也似乎是一本论文集,背后却可以看出麦肯锡的一贯逻辑和风格。

Spark大数据处理:技术、应用与性能优化

Spark大数据处理:技术、应用与性能优化

作者:
高彦杰
         
¥25.00

《Spark大数据处理:技术、应用与性能优化》是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。

大数据架构商业之路:从业务需求到技术方案

大数据架构商业之路:从业务需求到技术方案

作者:
黄申
         
¥25.00

为了达到深入浅出、通俗易懂的效果,本书的第一大部分概述了大数据的主要技术,包括大数据的获取、存储、处理,还有架构设计的基本理念,以及常用的消息和缓存机制。这一部分你会发现关于Nutch ,Flume ,Hadoop ,HBase ,Redis ,Hive ,Kafka ,Spark ,Storm等的简介。

Python数据分析与数据化运营

Python数据分析与数据化运营

作者:
宋天龙
         
¥49.00

这是一部从实战角度讲解如何利用Python进行数据分析、挖掘和数据化运营的著作,不仅对数据分析的关键技术和技巧进行了总结,更重要的是对会员、商品、流量、内容4个主题的数据化运营进行了系统讲解。

Spark技术内幕:深入解析Spark内核架构设计与实现原理

Spark技术内幕:深入解析Spark内核架构设计与实现原理

作者:
张安站
         
¥31.36

Spark是不断壮大的大数据分析解决方案家族中备受关注的新成员。它不仅为分布式数据集的处理提供了一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了统一的解决方案,因此极具竞争力。本书以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持,为更好地使用Spark Streaming、MLlib、Spark SQL和GraphX等奠定基础。

SQL优化最佳实践:构建高效率Oracle数据库的方法与技巧

SQL优化最佳实践:构建高效率Oracle数据库的方法与技巧

作者:
韩锋
         
¥25.00

本书从多角度阐述了SQL语句优化的方方面面,总体上可分为两大部分。第一部分主要讲解跟SQL优化相关的背景知识和基本原理;第二部分重点讲述了优化器的各种优化手段。

游戏数据分析的艺术

游戏数据分析的艺术

作者:
于洋
         
¥30.00

本书在着重解决游戏分析的基本认识、方法之外,还有更多对于业务理解的思考。本书分为两大部分:一部分贯穿了从基本的游戏数据分析概念、分析师的定位、数据指标认识、游戏数据分析方法论、统计学运用、渠道流量经营到具体的产品每个阶段用户的数据运营知识。二部分则重点阐述运用R语言和数据挖掘的知识,深入探讨游戏数据分析的高阶知识。

数据分析实战:基于EXCEL和SPSS系列工具的实践

数据分析实战:基于EXCEL和SPSS系列工具的实践

作者:
纪贺元
         
¥25.00

本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。

高并发Oracle数据库系统的架构与设计

高并发Oracle数据库系统的架构与设计

作者:
侯松
         
¥30.00

《数据库技术丛书:高并发Oracle数据库系统的架构与设计》主要内容从三个维度展开:首先是内部扩展的维度,深入探讨了高效B树索引、高效表设计、查询优化器等数据库架构设计与优化的核心技术,以及高并发Oracle数据库系统架构与设计的方法论和常见的高并发案例;其次是纵向扩展的维度,首次详细讲解内存数据库TimesTen的基本使用、高可用架构设计、缓存应用、监控方法、数据备份与恢复、数据迁移以及高并发场景;最后是横向扩展的维度,详细讲解了如何使用GoldenGate构建数据库群,重点是结合链路原理的实现,介绍了拓展数据集成平台和异构数据库群的设计思路。

大数据算法

大数据算法

作者:
王宏志
         
¥20.00

本书系统地介绍了大数据算法设计与分析的理论、方法和技术,针对大数据的特点,介绍了亚线性算法、外存算法、并行算法和众包算法。书中提供了大量关于大数据算法设计与分析的实例,旨在阐述大数据算法设计技术,有助于读者掌握相应的算法设计与分析方法。本书适用作为大数据相关专业本科生、研究生教材,也可供从事大数据相关工作的工程技术人员参考。

Oracle数据库性能优化方法论和最佳实践

Oracle数据库性能优化方法论和最佳实践

作者:
柳遵梁,应以峰,潘敏君
         
¥30.00

本书内容为Flow of Work Unit Time Based Analysis性能优化方法论的**部分,主要介绍基于流程响应和流程分解的响应时间分析方法论。基本按照以下方式来展开论述:第一部分:从性能优化常见的困惑和场景出发引出一些性能优化的基本概念,并重点阐述了Oracle数据库性能优化的方法论发展。第二部分:重点阐述Flow of Work Unit Time Based Analysis优化方法论,阐述流程、资源和组件之间的相互作用,构建了流程响应的输入输出的性能优化指标体系。第三部分:资源供给,重点阐述流程、资源和组件中的资源部分,全面分析了CPU、Memory、IOSub system,Network Sub System、Lock,Buffer Lock、Latch、Mutex等主要的Oracle数据库资源,并针对每种资源建立了独立的衡量评价体系。

ELK stack权威指南

ELK stack权威指南

作者:
饶琛琳
         
¥30.00

ELK stack是以Elasticsearch、Logstash、Kibana三个开源软件为主的数据处理工具链,是目前开源界最流行的实时数据分析解决方案,成为实时日志处理领域开源界的第一选择。然而,ELK stack并不是实时数据分析的灵丹妙药,使用不恰当,反而会事倍功半。本书对ELK stack的原理进行了解剖,不仅分享了大量实战案例和实现效果,而且分析了部分源代码,使读者不仅知其然还知其所以然。读者可通过本书快速掌握实时日志处理方法,并搭建自己的数据分析系统。本书分为三大部分,共19章。第一部分“Logstash”介绍Logstash的安装与配置、场景示例、性能与测试、扩展方案、源码解析、插件开发等;第二部分“Elasticsearch”介绍Elasticsearch的架构原理、数据接口用例、性能优化、测试和扩展方案、映射与模板的定制、监控方案等;第三部分“Kibana”介绍Kibana 3和Kibana 4的特点对比,并分别讲解了Kibana 3和Kibana 4的配置、案例与源代码解析。

Python数据科学实践指南

Python数据科学实践指南

作者:
纪路
         
¥40.12

本书分为三大部分,其中第1~4章是Python基础,这个部分会介绍阅读本书所必须掌握的Python知识。第5~7章是讲解Python直接提供的数据处理工具,这些工具包括一些易用的数据结构、标准库和第三方工具。第8~12章是一些实际的案例,将会涉及Python主要擅长的几个领域。后的三个附录分别介绍了关于Python的一些扩展知识。

大数据系统构建:可扩展实时数据系统构建原理与最佳实践

大数据系统构建:可扩展实时数据系统构建原理与最佳实践

作者:
【美】南森·马茨;【美】詹姆斯·沃伦
         
¥30.00

本书内容丰富,涵盖了大数据的诸多方面,如Thrift、数据建模、HDFS、MapReduce、HBase、Lambda等,这为本书的翻译增加了不少难度。尽管我们进行了多次校对和修改,甚至几位译者就某些专业词汇如何准确翻译进行了多次字斟句酌的讨论,但由于水平所限,恐难以将原作的内容全面还原,因此也难免出现纰漏和不足。在此,也恳请广大读者在阅读之余不吝赐教,给予批评指正。

MySQL DBA修炼之道

MySQL DBA修炼之道

作者:
陈晓勇
         
¥30.00

本书以实战讲解为主,摒弃了生产实践中不常用的知识和技术。书中内容主要分为5部分。第壹部分介绍MySQL的应用领域和适用场景、基础架构、常见生产环境部署方式,以及MySQL安装部署方式等内容。第二部分给出DBA、开发人员需要熟悉的一些知识,比如开发基础知识,如何选择合适的数据类型、事务的隔离级别和死锁避免等。第三部分则会介绍DBA及测试人员需要熟悉的测试知识,包括自动化压力测试、硬件性能测试。第四部分对照DBA的工作讲述生产的实际操作步骤,包括如何部署、升级、迁移备份数据等内容。第五部分讲述性能调优的工具和手段,如何进行数据规划,如何设计高可用性、高性能、伸缩性良好的系统。

网易公司版权所有©1997-2017   网络出版服务许可证(总)网出证(粤)字第030号   信息网络传播视听节目许可证号1908260   增值电信业务经营许可证 粤B2-20090191

工业和信息化部备案管理系统网站

Hi,,