从内容来说,本书探讨的话题涵盖面很广,你可以看到中年危机、女性意识、婚姻问题、操纵与索求、情绪勒索、自我探索、现实问题等话题,以及歇斯底里症、强迫性思想、偏头痛、焦虑等病征的描述。
这是一部从实战角度讲解如何利用Python进行数据分析、挖掘和数据化运营的著作,不仅对数据分析的关键技术和技巧进行了总结,更重要的是对会员、商品、流量、内容4个主题的数据化运营进行了系统讲解。
本书系统地介绍了大数据算法设计与分析的理论、方法和技术,针对大数据的特点,介绍了亚线性算法、外存算法、并行算法和众包算法。书中提供了大量关于大数据算法设计与分析的实例,旨在阐述大数据算法设计技术,有助于读者掌握相应的算法设计与分析方法。本书适用作为大数据相关专业本科生、研究生教材,也可供从事大数据相关工作的工程技术人员参考。
多名专家联袂推荐,资深专家联合撰写,深入理解Redis 5设计精髓。本书系统讲解Redis 5设计、数据结构、底层命令实现,以及持久化、主从复制、集群的实现。
本书在着重解决游戏分析的基本认识、方法之外,还有更多对于业务理解的思考。本书分为两大部分:一部分贯穿了从基本的游戏数据分析概念、分析师的定位、数据指标认识、游戏数据分析方法论、统计学运用、渠道流量经营到具体的产品每个阶段用户的数据运营知识。二部分则重点阐述运用R语言和数据挖掘的知识,深入探讨游戏数据分析的高阶知识。
本书从实践出发,结合大量数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出地介绍数据挖掘建模过程中的有关任务:数据探索、数据预处理、分类与预测、聚类分析、时序预测、关联规则挖掘、智能推荐和偏差检测等。因此,图书的编排以解决某个应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建。在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。
本书分为三大部分,其中第1~4章是Python基础,这个部分会介绍阅读本书所必须掌握的Python知识。第5~7章是讲解Python直接提供的数据处理工具,这些工具包括一些易用的数据结构、标准库和第三方工具。第8~12章是一些实际的案例,将会涉及Python主要擅长的几个领域。后的三个附录分别介绍了关于Python的一些扩展知识。
本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。
本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。
随着大数据时代的来临,各种数据分析和可视化软件层出不穷,如何处理并直观展示大数据,成为了很多人都关心的一个话题。虽然应运而生了多个数据可视化工具,但随着微软Power BI软件的推出,并在行业的占有率越来越高,Power BI成为了众多大型企业青睐的数据分析对象。本书是基于Powe BI软件编写的书籍,由浅入深地讲解了Power BI的基础技术知识,就算是零基础的读者也能够快速上手操作。本书还对快速实现数据的智能分析与可视化进行了详细的介绍,并利用多个案例让读者融会贯通。通过本书的学习,您将从过去繁琐的数据处理、报表编制中解脱出来,瞬间做出美观、动态的交互式商业报告,实现公司企业内部数据可视化分析与分享,从而洞察数据的意义,实现管理的价值,大幅提升管理能力、管理水平。
本书以透彻的原理分析和充实的实例代码详解,全面阐述了Spark Streaming流式处理平台的相关知识,能够让读者快速掌握如何搭建Spark平台,然后在此基础上学习流式处理框架,并动手实践进行Spark Streaming流式应用的开发,包括与主流平台框架的对接应用,以及项目实战中的一些开发和调优策略等。本书共10章,分为3篇。第1篇为Spark基础,主要阐述了Spark的基本原理、平台搭建及实例应用;第2篇为Spark Streaming详解,阐述了Spark Streaming的基本原理,并重点介绍了Spark Streaming与Kafka、ZooKeeper、MySQL、HBase和Redis的配合使用、相关调优策略及实际应用;第3篇为Spark Streaming案例实战,主要介绍了实时词频统计处理、用户行为统计和监控报警系统3个实战案例,帮助读者进行实战演练,提升读者的实际项目开发水平。另外,本书附录还对Scala语言基础做了简要讲解。本书内容理论结合实战,特别适合大数据技术爱好者及相关从业人员阅读,也可作为他们的常备工具书使用。另外,本书也适合作为大数据培训机构及高校相关专业的教材使用。
本书以实战讲解为主,摒弃了生产实践中不常用的知识和技术。书中内容主要分为5部分。第壹部分介绍MySQL的应用领域和适用场景、基础架构、常见生产环境部署方式,以及MySQL安装部署方式等内容。第二部分给出DBA、开发人员需要熟悉的一些知识,比如开发基础知识,如何选择合适的数据类型、事务的隔离级别和死锁避免等。第三部分则会介绍DBA及测试人员需要熟悉的测试知识,包括自动化压力测试、硬件性能测试。第四部分对照DBA的工作讲述生产的实际操作步骤,包括如何部署、升级、迁移备份数据等内容。第五部分讲述性能调优的工具和手段,如何进行数据规划,如何设计高可用性、高性能、伸缩性良好的系统。
本书分13章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这三大方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评估的整个环节。企业大数据的知识完整性也是本书的特色之一。
首先,通过讲解网站的信息架构和工作原理,不仅系统介绍有哪些分析指标,而且会详细介绍每一个指标的使用场景;不仅会分析每个指标数据的作用和局限性,而且还会介绍这些数据如何与业务结合才能产生价值。其次,通过讲解以业务为中心的代码设计、Tag Manager高级代码实施、Google Analytics跨屏追踪、网站流量分类原理及逻辑,详细讲解了如何分析数据、选择数据、使用数据才能确保分析结果的价值,最终为网站的运营提供决策依据。
本书作者从实践出发,结合大量大数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出介绍大数据挖掘项目中针对数据分析的各个流程:数据探索、数据预处理、分类与预测、聚类分析、关联规则挖掘、智能推荐等。因此,图书的编排以解决某个大数据应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述针对这个目标使用的大数据挖掘分析方法与过程,最后完成模型构建,在介绍建模过程中会针对每个大数据项目的特点进行分析,同时提供上机实验,把相关的建模操作提供给读者。
数据库的基本特征之一是支持多用户共享数据,而事务管理和并发控制是提供这一支持的核心技术,是大型数据库有别于某些表格管理软件的关键特性之一,也是实现一个大型数据库管理系统时会面临的最有挑战性的技术之一。本书从基本原理和案例系统分析深刻论述了该领域的进展现状与典型实现技术,特别是源码分析对有志于学习或定制开源数据库管理系统的开发人员提供了很好的参考。对数据库有关的各类从业者了解这一主题提供了难得的参考资料。
本书基于作者多年在个人数据管理方面的研究积累,对个人数据管理相关技术进行了总结和整理,内容涵盖了个人数据管理技术的发展、数据模型、数据集成、数据融合、数据存储、数据查询、系统实现、个人数据管理新技术发展几个部分。
从行为脉络来看,本书基本上是从数据统计、数据指标理解、数据模型、聚类/分类与机器学习、数据应用、大数据框架补充知识,以及扩展讨论这样的角度来层层深入完成的。这种方式会给读者比较好的带入感,让大家——尤其是不擅长数学的读者降低对大数据与机器学习算法的恐惧感。如果读者朋友对排列组合、统计分布这些基础知识比较了解,完全可以考虑跳过这些部分直接去读后面更感兴趣的内容。为了调节阅读气氛,我们还尝试加入了一些漫画插图。为了让读者朋友能够更快地进行实践,我们几乎在每一个算法讲解后都配有Python或者SQL语言的实现部分。相信这些能够帮助大家更快、更轻松地阅读本书。
本书是一本指导用户和云计算服务从业人员规划与实施企业应用、数据库、大数据等迁移上云的工程类书籍,融合了阿里云技术服务团队多年的实战和思考。本书按照“点—线—面—体”的思路,逐步深入介绍云计算的基础知识、应用迁移、数据库迁移、数据存储迁移、大数据迁移、应用优化、云上架构规划与设计等内容,并结合案例展开,使读者更深刻地理解和掌握企业迁云的过程和需要注意的问题。