《pandas数据处理与分析》 - 耿远昊 - 人民邮电出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書

『簡體書』pandas数据处理与分析

書城自編碼： 3774746
分類：簡體書→大陸圖書→計算機/網絡→程序設計
作者：耿远昊
國際書號(ISBN)： 9787115583659
出版社：人民邮电出版社
出版日期： 2022-08-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 120.5

我要買件

** 我創建的書架 **
未登入.

新書推薦：

炙野（全2册）

《炙野（全2册）》
售價：HK$ 78.2

女人的胜利

《女人的胜利》
售價：HK$ 55.9

数据有道：数据分析+图论与网络+微课+Python编程（鸢尾花数学大系：从加减乘除到机器学习）

《数据有道：数据分析+图论与网络+微课+Python编程（鸢尾花数学大系：从加减乘除到机器学习）》
售價：HK$ 266.6

500万次倾听：陪伤心的人聊聊

《 500万次倾听：陪伤心的人聊聊》
售價：HK$ 53.8

英国商业500年（见证大国崛起与企业兴衰，启迪未来商业智慧。）

《英国商业500年（见证大国崛起与企业兴衰，启迪未来商业智慧。）》
售價：HK$ 80.6

万千心理·儿童心理治疗中的心智化：临床实践指导

《万千心理·儿童心理治疗中的心智化：临床实践指导》
售價：HK$ 87.4

自我囚禁的人：完美主义的心理成因与自我松绑（破除你对完美主义的迷思，尝试打破自我评价过低与焦虑的恶性循环）

《自我囚禁的人：完美主义的心理成因与自我松绑（破除你对完美主义的迷思，尝试打破自我评价过低与焦虑的恶性循环）》
售價：HK$ 66.1

《周易》
售價：HK$ 44.6

建議一齊購買：

+

HK$ 121.8
《数学建模：算法与编程实现》

+

HK$ 110.5
《R&Python数据科学与机器学习实践》

+

HK$ 127.7
《Visual Basic 2013从入门到精通（微软技术丛书》

+

HK$ 116.2
《TypeScript编程》

+

HK$ 59.4
《Visual Basic程序设计教程（第5版）》

+

HK$ 117.5
《HTML5移动Web+Vue.js应用开发实战》

編輯推薦：

1.梳理pandas中常用的函数，将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构2.展示了数据处理的宏观体系，并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。3.结合大量代码讲解理论知识，并通过“练一练”和章末的“习题”等形式提供高质量的练习，帮助读者理解、强化和拓展所学知识。4.不需要读者掌握数据科学或数据分析的先验知识，适合具有一定Python编程基础、想要使用pandas进行数据处理与分析的数据科学领域的从业者或研究人员阅读。

內容簡介：

本书以Python中的pandas库为主线，介绍各类数据处理与分析方法。本书共包含13章，第一部分介绍NumPy和pandas的基本内容；第二部分介绍pandas库中的4类操作，包括索引、分组、变形和连接；第三部分介绍基于pandas库的4类数据，包括缺失数据、文本数据、分类数据和时间序列数据，并介绍这4类数据的处理方法；第四部分介绍数据观测、特征工程和性能优化的相关内容。本书以丰富的练习为特色，每章的最后一节为习题，同时每章包含许多即时性的练习（练一练）。读者可通过这些练习将对数据科学的宏观认识运用到实践中。

關於作者：

耿远昊威斯康星大学麦迪逊分校统计学硕士在读，Datawhale成员，“Joyful Pandas”开源项目作者。pandas贡献者，活跃于pandas开源社区，主要贡献涉及漏洞修复、功能实现与性能优化等方面，对pandas在数据处理与分析中的应用有丰富经验。

目錄：

第一部分　基础知识第　1章预备知识　21.1　Python基础　21.1.1　推导式　21.1.2　匿名函数　41.1.3　打包函数　51.2　NumPy基础　71.2.1　NumPy数组的构造　71.2.2　NumPy数组的变形　111.2.3　NumPy数组的切片　151.2.4　广播机制　171.2.5　常用函数　191.3　习题　24第　2章 pandas基础　262.1　文件的读取和写入　262.1.1　文件读取　262.1.2　数据写入　282.2　基本数据结构　292.2.1　Series　292.2.2　DataFrame　302.3　常用基本函数　322.3.1　汇总函数　332.3.2　特征统计函数　342.3.3　频次函数　352.3.4　替换函数　362.3.5　排序函数　392.3.6　apply()函数　402.4　窗口　422.4.1　滑动窗口　422.4.2　扩张窗口　452.5　习题　46第二部分　4类操作第3章　索引　503.1　单级索引　503.1.1　DataFrame的列索引　503.1.2　Series的行索引　513.1.3　loc索引器　523.1.4　iloc索引器　563.1.5　query()函数　573.1.6　索引运算　583.2　多级索引　593.2.1　多级索引及其表的结构　593.2.2　多级索引中的loc索引器　613.2.3　多级索引的构造　653.3　常用索引方法　663.3.1　索引层的交换和删除　663.3.2　索引属性的修改　673.3.3　索引的设置与重置　703.3.4　索引的对齐　713.4　习题　72第4章　分组　744.1　分组模式及其对象　744.1.1　分组的一般模式　744.1.2　分组依据的本质　754.1.3　groupby对象　764.2　聚合函数　784.2.1　内置聚合函数　784.2.2　agg()函数　794.3　变换和过滤　804.3.1　变换函数　814.3.2　组索引与过滤　824.4　跨列分组　834.5　习题　85第5章　变形　875.1　长宽表的变形　875.1.1　长表的透视变形　885.1.2　宽表的逆透视变形　915.2　其他变形方法　955.2.1　索引变形　955.2.2　扩张变形　985.3　习题　98第6章　连接　1006.1　关系连接　1006.1.1　关系连接的基本概念　1006.1.2　列连接　1026.1.3　索引连接　1046.2　其他连接　1056.2.1　方向连接　1056.2.2　比较与组合　1086.3　习题　109第三部分　4类数据第7章　缺失数据　1147.1　缺失值的统计和删除　1147.1.1　缺失信息的统计　1147.1.2　缺失信息的删除　1157.2　缺失值的填充和插值　1167.2.1　利用fillna() 进行填充　1167.2.2　插值函数　1187.3　Nullable类型　1207.3.1　缺失记号及其缺陷　1207.3.2　Nullable类型的性质　1227.3.3　缺失数据的计算和分组　1247.4　习题　126第8章　文本数据　1288.1　str对象　1288.1.1　str对象的设计意图　1288.1.2　[]索引器　1298.1.3　string类型　1298.2　正则表达式基础　1318.2.1　元字符　1328.2.2　分组捕获与反向引用　1348.2.3　零宽断言　1358.3　文本处理的5类操作　1368.3.1　拆分　1368.3.2　合并　1378.3.3　匹配　1388.3.4　替换　1398.3.5　提取　1408.4　其他字符串方法　1418.4.1　字母型方法　1418.4.2　数值型方法　1428.4.3　统计型方法　1438.4.4　格式型方法　1438.5　习题　145第9章　分类数据　1479.1　cat对象　1479.1.1　cat对象的属性　1479.1.2　类别的增加、删除和修改　1489.2　有序类别　1509.2.1　序的建立　1509.2.2　排序和比较　1509.3　区间类别　1529.3.1　利用cut()和qcut()进行区间构造　1529.3.2　一般区间的构造　1539.3.3　区间的属性与方法　1559.4　习题　155第　10章时间序列数据　15910.1　时间戳　16010.1.1　时间戳的构造与属性　16010.1.2　时间戳序列的生成　16110.1.3　dt对象　16410.1.4　时间戳序列的索引与切片　16610.2　时间差　16710.2.1　时间差序列的生成　16810.2.2　时间差序列的运算　16910.3　日期偏置　17010.3.1　Offset对象　17010.3.2　采样频率　17310.4　时间序列操作　17510.4.1　采样频率滑窗　17510.4.2　重采样　17710.4.3　特殊连接　18110.5　习题　184第四部分　进阶实战第　11章数据观测　19011.1　可视化方法　19011.1.1　基本绘图　19011.1.2　元素控制　19811.1.3　子图绘制　20311.2　数据观测方法　20611.2.1　数据类型　20611.2.2　数据统计量　20711.2.3　数据分布　20911.2.4　基于数据报告的观测　21011.3　习题　212第　12章特征工程　21612.1　单特征构造　21612.1.1　特征变换　21612.1.2　文本数据特征　22312.1.3　时间序列数据特征　22612.1.4　单特征构造的一般方法　23012.2　多特征构造　23612.2.1　分组技术　23612.2.2　特征降维　23912.3　特征选择　24212.3.1　基于统计量的选择　24212.3.2　基于模型的选择　24912.4　习题　255第　13章性能优化　25813.1　pandasic代码要义　25813.2　多进程加速　26113.2.1　多进程和多线程　26113.2.2　多进程的陷阱　26413.2.3　异步进程　26813.2.4　进程中的数据共享　27113.2.5　在pandas中使用多进程　28213.3　利用Cython加速　28613.3.1　初识Cython　28613.3.2　优化策略　28813.3.3　多线程加速　29513.3.4　Cython类及其应用　30613.3.5　模块构建　31113.4　利用Numba加速　31513.4.1　noPython模式　31513.4.2　ufunc与向量化　32013.4.3　jitclass及其应用　32313.5　习题　325

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.