《Python机器学习案例教程（原书第2版）》 - 刘宇熙[Yuxi Liu] - Meg Book Store - 香港.大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書

『簡體書』Python机器学习案例教程（原书第2版）

書城自編碼： 3625572
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者：刘宇熙[Yuxi Liu]
國際書號(ISBN)： 9787111677109
出版社：机械工业出版社
出版日期： 2021-05-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 111.3

我要買件

** 我創建的書架 **
未登入.

新書推薦：

日本百鬼画谱

《日本百鬼画谱》
售價：HK$ 71.3

大明拐点：天启党争

《大明拐点：天启党争》
售價：HK$ 66.7

纲鉴易知录评注（布面精装全8册）

《纲鉴易知录评注（布面精装全8册）》
售價：HK$ 572.7

官商跃迁：中国古代政商关系简史

《官商跃迁：中国古代政商关系简史》
售價：HK$ 101.2

当代学术·乡族与国家：多元视野中的闽台传统社会（修订本）

《当代学术·乡族与国家：多元视野中的闽台传统社会（修订本）》
售價：HK$ 101.2

了不起的中国冠军：讲给孩子的奥运故事

《了不起的中国冠军：讲给孩子的奥运故事》
售價：HK$ 78.2

海外中国研究·北京的六分仪：中国历史中的全球潮流

《海外中国研究·北京的六分仪：中国历史中的全球潮流》
售價：HK$ 78.2

霍比特人（插图典藏版，150余幅精美全彩插图，原作地图首度汉化为简体中文，2024年全新译本）

《霍比特人（插图典藏版，150余幅精美全彩插图，原作地图首度汉化为简体中文，2024年全新译本）》
售價：HK$ 124.2

建議一齊購買：

+

HK$ 113.9
《Python机器学习实战》

+

HK$ 104.3
《Jupyter数据科学实战》

+

HK$ 130.7
《TensorFlow深度学习（原书第2版）》

+

HK$ 95.7
《Python并行编程参考手册（影印版）》

+

HK$ 98.8
《机器学习算法》

+

HK$ 277.2
《Python机器学习实战：真实智能案例实践指南》

內容簡介：

本书包括3部分：第1部分介绍机器学习的基本概念，它们是机器学习的预备知识；第2部分系统介绍几种成熟的机器学习算法和技术；第3部分介绍贯穿整个机器学习工作流程的21个最佳案例，并且讨论具有前瞻性的方法和想法，它们被公认为是机器学习未来的研究重点。本书中的代码均在Python 3中测试通过。本书适合高等院校相关专业的大学生、研究生或教师阅读学习，以及不具有机器学习或统计背景但是想要快速补充机器学习算法知识，以便在实际产品或平台中应用的软件工程师。Copyright  Packt Publishing 2019First published in the English language under the title“Python Machine Learning By Example-Second Edition-(9781789616729)”Copyright in the Chinese language(simplified characters) 2021 China Machine PressThis title is published in China by China Machine Press with license from Packt Publishing Ltd.This edition is authorized for sale in China only， excluding Hong Kong SAR， Macao SAR and Taiwan.Unauthorized export of this edition is a violation of the Copyright Act.Violation of this Law is subject to Civil and Criminal Penalties.本书由Packt Publishing Ltd授权机械工业出版社在中华人民共和国境内（不包括香港、澳门特别行政区及台湾地区）出版与发行。未经许可的出口，视为违反著作权法，将受法律制裁。北京市版权局著作权合同登记图字：01-2019-5823号。

目錄：

译者序前言第1部分机器学习的基础第1章机器学习和Python入门1.1超高水平的机器学习技术概述1.1.1机器学习任务的分类1.1.2机器学习算法的发展简史1.2机器学习的核心——数据泛化1.2.1过拟合、欠拟合和偏差-方差权衡1.2.2利用交叉验证避免过拟合1.2.3利用正则化避免过拟合1.2.4通过特征选择和降维避免过拟合1.3预处理、探索和特征工程1.3.1缺失值1.3.2标签编码1.3.3独热编码1.3.4缩放1.3.5多项式特征1.3.6幂变换1.3.7分箱1.4组合模型1.4.1投票法和平均法1.4.2装袋法1.4.3提升方法1.4.4堆叠法1.5安装软件和设置1.5.1设置Python和环境1.5.2安装各种软件包本章小结习题第2部分Python机器学习实例第2章使用文本分析技术研究20组新闻数据集2.1计算机如何理解语言——NLP2.2浏览NLP库并学习NLP基础知识2.2.1语料库2.2.2标记2.2.3词性2.2.4命名实体识别2.2.5词干提取和词形还原2.2.6语义和主题建模2.3获取新闻组数据2.4研究新闻组数据2.5考虑文本数据的特性2.5.1计算每个单词表征的出现次数2.5.2文本预处理2.5.3丢弃停止词2.5.4词干提取和词形还原法2.6使用t-SNE可视化新闻组数据2.6.1什么是降维2.6.2用于降维的t-SNE本章小结习题第3章使用聚类和主题建模算法挖掘20组新闻数据集3.1没有指导的学习——无监督学习3.2使用k均值聚类算法对新闻数据集进行聚类3.2.1k均值聚类算法是如何聚类的?3.2.2从头实现k均值聚类算法3.2.3用机器学习实现k均值聚类算法3.2.4k值的选择3.2.5使用k均值聚类新闻组数据3.3在新闻组中发现基础主题3.4使用NMF进行主题建模3.5使用LDA进行主题建模本章小结习题第4章使用朴素贝叶斯检测垃圾邮件4.1从分类开始4.1.1分类算法的类型4.1.2文本分类的应用4.2探索朴素贝叶斯4.2.1通过案例来学习贝叶斯定理4.2.2朴素贝叶斯的结构4.2.3运用scratch库实现朴素贝叶斯分类器4.2.4运用scikit-learn库实现朴素贝叶斯分类器4.3分类性能评估4.4模型调优和交叉验证本章小结习题第5章使用支持向量机对新闻组主题进行分类5.1用支持向量机寻找分离边界5.1.1通过不同的示例了解支持向量机如何工作5.1.2实现支持向量机5.1.3支持向量机的核心5.1.4在线性核和RBF核之间进行选择5.2使用支持向量机对新闻组主题进行分类5.3更多示例——心脏造影的胎儿状态分类5.4另一个示例——使用TensorFlow完成基于支持向量机的乳腺癌分类本章小结习题第6章使用基于树的算法预测在线广告点击率6.1广告点击率预测概述6.2两种类型数据：数值型和分类型6.3从根到叶探索决策树6.3.1构建决策树6.3.2衡量分裂的标准6.4从头实现决策树6.5用决策树预测广告点击率6.6集成决策树——随机森林6.6.1使用TensorFlow实现随机森林本章小结习题第7章使用逻辑回归预测在线广告点击率7.1将分类特征转换为数字特征——独热编码和顺序编码7.2用逻辑回归对数据进行分类7.2.1逻辑函数入门7.2.2从逻辑函数到逻辑回归7.3训练逻辑回归模型7.3.1利用梯度下降训练逻辑回归模型7.3.2利用梯度下降的逻辑回归模型预测在线广告点击率7.3.3利用随机梯度下降训练逻辑回归模型7.3.4利用正则化训练逻辑回归模型7.4通过在线学习训练大型数据集7.5处理多元分类7.6使用TensorFlow实现逻辑回归7.7使用随机森林进行特征选择本章小结习题第8章将预测扩展到TB级点击日志8.1学习Apache Spark的基本知识8.1.1了解 Spark8.1.2安装Spark8.1.3启动和部署Spark程序8.2在PySpark中编程8.3使用Spark学习大量点击日志8.3.1加载点击日志8.3.2拆分和缓存数据8.3.3对分类特征进行独热编码8.3.4训练和测试逻辑回归模型8.4使用Spark对分类变量进行特征工程8.4.1散列分类特征8.4.2组合多个变量——特征交互本章小结习题第9章使用回归算法预测股票价格9.1有关股票市场和股票价格的简要概述9.2什么是回归9.3获取股价数据9.3.1开始特征工程9.3.2获取数据并生成特征9.4使用线性回归来估计9.4.1线性回归是如何工作的9.4.2实现线性回归9.5使用回归树进行预测9.5.1从分类树到回归树9.5.2实现回归树9.5.3实现随机森林9.6用支持向量回归机进行评估9.6.1实现支持向量回归机9.7用神经网络进行估算9.7.1揭开神经网络的神秘面纱9.7.2实现神经网络9.8评估回归性能9.9使用四种回归算法预测股票价格本章小结习题第3部分Python机器学习案例第10章机器学习案例10.1机器学习解决方案流程10.2数据准备阶段的案例10.2.1案例1——完全理解项目目标10.2.2案例2——收集所有相关的特征10.2.3案例3——保持特征值的一致性10.2.4案例4——处理缺失数据10.2.5案例5——存储大规模数据10.3训练集生成阶段的案例10.3.1案例6——区分分类型特征与数值型特征10.3.2案例7——决定是否要对分类型特征进行编码10.3.3案例8——决定是否要选择特征和如何选择10.3.4案例9——决定是否要降维和如何降维10.3.5案例10——决定是否重新调整特征取值10.3.6案例11——在拥有专业知识的条件下进行特征工程10.3.7案例12——在缺少专业知识的条件下进行特征工程10.3.8案例13——记录每个特征是如何生成的10.3.9案例14——从文本数据中提取特征10.4模型训练、评估和选择阶段的案例10.4.1案例15——选择合适的起步算法10.4.2案例16——减少过拟合10.4.3案例17——识别过拟合与欠拟合10.4.4案例18——在大型数据集上建模10.5部署和监视阶段的案例10.5.1案例19——保存、加载和重用模型10.5.2案例20——监控模型性能10.5.3案例21——定期更新模型本章小结习题

內容試閱：

人们之所以会对机器学习产生浓厚的兴趣，是因为它可以通过学习数据中的模式，并利用这些模式做出预测和决策，从而革命性地实现自动化。如果你对机器学习感兴趣，本书可以作为你的入门书籍。本书是《Python机器学习案例教程》的第2版，从介绍Python库的重要概念和实现开始，每章都会引导你了解一个行业使用的应用程序。你可以通过简单易懂的方式在探索性数据分析、特征工程和自然语言处理（Natural Language Processing，NLP）等领域中应用机器学习技术。本书将帮助你学习如何解决数据驱动的问题，并利用简单而强大的Python语言、流行的Python包和工具（如TensorFlow、scikit-learn库、Gensim和Keras）解决问题。为了帮助你理解流行的机器学习算法，本书使用了许多有趣且简单的示例，如新闻主题建模和分类、垃圾邮件检测和股票价格预测。通过本书，你将对机器学习的体系结构有一个全面的了解，并熟练掌握如何应用机器学习技术来迎接新的机会和挑战。本书受众如果你是一个对机器学习有浓厚兴趣的数据分析师或者是一个对机器学习充满激情的数据工程师，那么本书就是为你准备的。如果你之前已经了解并掌握Python编码的基础知识和统计学基本概念，将对学习本书很有帮助。但是如果你不了解上述知识和概念，也没关系。本书包含的内容第1章，机器学习和Python入门，这将是读者进入Python机器学习领域的起点。本章将介绍机器学习的基本概念，其余部分将在之后的章节探讨。此外，本章还将讨论Python机器学习的基础知识，并解释如何在后续的示例和项目中正确运用它。第2章，使用文本分析技术研究20组新闻数据集。本章将开发本书的个项目，研究和挖掘20组新闻数据集。该项目拆分为两章：第2章——使用文本分析技术研究20组新闻数据集及第3章——使用聚类和主题建模算法挖掘20组新闻数据集。在本章中，读者将熟悉本项目相关的NLP和各种NLP库的使用以及几个重要的NLP技术如何在NLTK中实现。此外，还将介绍降维技术，特别是t-SNE在文本数据可视化中的应用。第3章，使用聚类和主题建模算法挖掘20组新闻数据集。在研究了20组新闻数据集之后，继续上一章的新闻组项目。在本章中，读者将学习无监督学习中的聚类算法和一些先进的NLP技术，如LDA和词嵌入。使用k均值算法对新闻组数据进行聚类，并使用NMF和LDA进行主题检测。第4章，使用朴素贝叶斯检测垃圾邮件，开始监督学习之旅。本章将重点讨论如何使用朴素贝叶斯算法分类，并将其实现。本章还将介绍机器学习领域中的其他重要概念，如分类性能评估、模型选择和调优以及交叉验证。本章后将演示垃圾邮件检测等示例。第5章，使用支持向量机对新闻组主题进行分类。本章将重用在第2章和第3章中使用过的数据集，也将介绍多元分类、支持向量机以及它们在主题分类中的应用。本章还将提到一些其他重要的概念，如内核机、过拟合和正则化。第6章，使用基于树的算法预测在线广告点击率。本章在解决广告点击率问题的过程中，将深入介绍和解释决策树和随机森林。此外，还将介绍基于树模型的重要概念，如集合、特征重要性和特征选择。第7章，使用逻辑回归预测在线广告点击率。本章将介绍和解释前几章中关于同一项目的逻辑回归分类。此外，还将介绍其他概念，如分类变量编码、L1和L2正则化、特征选择、在线学习和随机梯度下降以及如何处理大型数据集。第8章，将预测扩展到TB级点击日志。本章将介绍在线广告点击率预测，在一个典型的大型机器学习问题中，有数以百万计的标签样本，本章将利用诸如Apache Hadoop和Spark等强大的并行计算工具来探索一个比前几章更完善的解决方案。此外，还将介绍Spark的基本概念，如安装、RDD和核心编程以及机器学习组件。使用整个数百万个样本的数据集探索数据，构建分类模型，执行特征工程，并使用Spark进行性能评估，这在一定程度上扩大了计算范围。第9章，使用回归算法预测股票价格。本项目的目的是利用雅虎/谷歌的财务数据以及其他可能的附加数据来分析和预测股票的市场价格。本章从金融领域遇到的挑战开始，并简要解释相关概念；紧接着获取和探索数据集，并在探索性数据分析后开始特征工程；核心部分将介绍回归和回归算法、线性回归、决策树、SVR以及神经网络。你还将练习使用scikit-learn库和TensorFlow API解决回归问题。第10章，机器学习案例。本章涵盖了机器学习中的案例。学习本书介绍的多个项目之后，你将对Python的机器学习体系结构有一个大致的了解。但是，你一旦开始处理实际项目，仍然会遇到一些问题。本章主要在整个机器学习流程中提供21种案例，既为读者的学习提供保障，也为读者处理项目提供指引。充分利用这本书你需要具备Python的基本知识、基础的机器学习算法以及一些Python库，如TensorFlow和Keras，这样可以使你的项目模型更加简单。下载示例代码文件你可以下载本书的示例代码文件，网址为www.packt.com。如果是在其他地方购买了这本书，可以访问www.packt.com/support并注册，文件将直接通过电子邮件发送给你。按照以下步骤下载代码文件：1）登

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.