新書推薦:
《
资治通鉴熊逸版:第四辑
》
售價:HK$
470.8
《
中国近现代名家精品——项维仁:工笔侍女作品精选
》
售價:HK$
66.1
《
宋瑞驻村日记(2012-2022)
》
售價:HK$
115.6
《
汗青堂丛书138·帝国的切口:近代中国口岸的冲突与交流(1832-1914)
》
售價:HK$
127.4
《
人世事,几完缺 —— 啊,晚明
》
售價:HK$
115.6
《
樊树志作品:重写明晚史系列(全6册 崇祯传+江南市镇的早期城市化+明史十二讲+图文中国史+万历传+国史十六讲修订版)
》
售價:HK$
498.0
《
真谛全集(共6册)
》
售價:HK$
1156.4
《
敦煌通史:魏晋北朝卷
》
售價:HK$
162.3
|
編輯推薦: |
1.技术型科普书,属于情感分析方向零基础入门读物;2.全书语言文字简洁易懂,对初学者友好;3.本书作者是清华大学人工智能方向老师,有非常强的专业能力;4.本书理论与实践结合,但尽量避免了烦琐公式。
|
內容簡介: |
“人工智能超入门丛书”致力于面向人工智能各技术方向零基础的读者,内容涉及数据思维、机器学习、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,体系完整、内容简洁、文字通俗,综合介绍人工智能相关知识,并辅以程序代码解决问题,使得零基础的读者快速入门。《情感分析:人工智能如何洞察心理》是“人工智能超入门丛书”中的分册,本分册以通俗易懂的文字风格,介绍了不同的人工智能技术解决情感分析问题的方法,如情感词典、机器学习、深度学习等。内容丰富而简明,包括分词、网络爬虫、词袋模型、朴素贝叶斯、逻辑回归、NPLM模型、Word2Vec模型、LSTM模型等。同时,本书配有关键代码,并在附录中给出了PyTorch的入门介绍以及概率基础知识回顾,让读者在学习过程中打好基础,快速上手,提升解决问题的能力。本书可以作为大学生以及想要走向自然语言处理(NLP)领域相关工作岗位的技术人员的入门读物,同时,对人工智能感兴趣的人群也可以阅读。
|
關於作者: |
龚超,工学博士,清华大学日本研究中心主任助理,深圳清华大学研究院下一代互联网研发中心核心成员,海口经济学院雅和人居工程学院客座教授。中国高科技产业化研究会理事、中国自动化学会普及工作委员会委员、中国人工智能学会中小学工作委员会委员、教育信息化教学应用实践共同体项目特聘专家。研究方向为人工智能优化算法,人工智能在数字化转型中的应用等。著有10本人工智能相关图书,多家500强企业数字化转型领域高级顾问,在国内外期刊上发表文章共计60余篇。张鹏宇,未来基因(北京)人工智能研究院中级研究员,中国人工智能学会中小学工作委员会培训讲师,中国人工智能学会、中国自动化学会、中国科学院大学人工智能学院全国中小学人工智能探究性学习训练营导师,中国自动化学会青少年人工智能核心素养测评特聘专家,北京科学中心人工智能高级研修营指导教师。喻涛,博士,清华大学网络科学与网络空间研究院网络试验设施研究室助理研究员,主要研究方向:网络体系结构、网络空间安全、未来互联网试验床、SDN/人工智能/大数据应用研究。目前在清华大学网络研究院网络试验设施研究室基于国家重大基础设施未来网络试验设施FITI项目开展网络空间安全应用研究、智能检测模型与对抗样本生成技术研究、应用流量迁移与优化研究、网络空间数字地图与资产测绘等研究工作。
|
目錄:
|
第1章 语挚情长路漫漫 001
1.1 文中自有真情在 002
1.1.1 问世间情为何物 002
1.1.2 触景文下留真情 004
1.2 NLP来相助 008
1.2.1 什么是NLP 008
1.2.2 NLP主要应用领域 012
1.3 情感即分类 015
1.3.1 情感分析的对象与方法 015
1.3.2 情感分析的主要应用 017
第2章 情感词典查情断意 019
2.1 分词与词典 020
2.1.1 分词,情感分析第一步 020
2.1.2 词典,让AI长知识 026
2.2 只有“情感”行不行 028
2.2.1 情感词典的建立 028
2.2.2 词典的扩充 031
2.3 基于情感词典的案例 034
第3章 玩转文本大数据 039
3.1 数据的获取 040
3.1.1 网络爬虫 040
3.1.2 简单爬虫案例 040
3.2 数据的清洗与整理 045
3.2.1 去除停用词 046
3.2.2 词性标注 054
3.3 词频与词云 055
3.3.1 词频统计 055
3.3.2 关键词统计 057
3.3.3 词云 059
3.4 词袋模型 063
3.4.1 词袋模型概念 063
3.4.2 简单词袋模型案例 065
3.4.3 改进词汇表 067
3.4.4 词袋模型显示频率 071
3.4.5 词袋模型的局限性 072
第4章 机器学习洞察句情 073
4.1 机器学习概述 074
4.1.1 什么是机器学习 074
4.1.2 机器学习与情感分析 077
4.1.3 词袋模型数据生成 081
4.2 朴素贝叶斯与情感分析 086
4.2.1 贝叶斯vs频率 086
4.2.2 朴素贝叶斯原理实践 087
4.3 二项逻辑回归与情感分析 097
4.3.1 逻辑回归原理 097
4.3.2 逻辑回归算法 100
第5章 神经网络触景悉情 102
5.1 神经网络工作原理 103
5.1.1 神经网络概述 103
5.1.2 前向与反向传播 104
5.1.3 其他参数 107
5.2 激活函数与损失函数 109
5.2.1 非线性的激活函数 109
5.2.2 衡量优劣的损失函数 115
5.3 神经网络的分类与情感分析 117
第6章 向量构筑语义空间 121
6.1 另辟蹊径分布表示 122
6.1.1 语料库 122
6.1.2 分布式假说 123
6.2 从NPLM到Word2Vec 126
6.2.1 NPLM模型 126
6.2.2 Word2Vec 128
6.3 Word2Vec实践 134
6.3.1 “女人-男人=王后-国王”的三国解读 134
6.3.2 词汇的星空 140
第7章 深情厚意咬文嚼字 145
7.1 循环神经网络 146
7.1.1 循环神经网络原理 146
7.1.2 循环神经网络实践 148
7.2 LSTM 151
7.2.1 LSTM基本原理 151
7.2.2 非礼勿记、非礼勿听、非礼勿言 153
7.3 循环神经网络与情感分析 157
附录 160
附录一 PyTorch入门 161
附录二 概率基础 168
附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 181
|
內容試閱:
|
新一代人工智能的崛起深刻影响着国际竞争格局,人工智能已经成为推动国家与人类社会发展的重大引擎。2017年,国务院发布《新一代人工智能发展规划》,其中明确指出:支持开展形式多样的人工智能科普活动,鼓励广大科技工作者投身人工智能知识的普及与推广,全面提高全社会对人工智能的整体认知和应用水平。实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育,鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广。
为了贯彻落实《新一代人工智能发展规划》,国家有关部委相继颁布出台了一系列政策。截至2022年2月,全国共有440所高校设置了人工智能本科专业,387所普通高等学校高等职业教育(专科)设置了人工智能技术服务专业,一些高校甚至已经在积极探索人工智能跨学科的建设。在高中阶段,“人工智能初步”已经成为信息技术课程的选择性必修内容之一。在2022年实现“从0到1”突破的义务教育阶段信息科技课程标准中,明确要求在7~9年级需要学习“人工智能与智慧社会”相关内容,实际上,1~6年级阶段的不少内容也与人工智能关系密切,是学习人工智能的基础。
人工智能是一门具有高度交叉属性的学科,笔者认为其交叉性至少体现在三个方面:行业交叉、学科交叉、学派交叉。在大数据、算法、算力三驾马车的推动下,新一代人工智能已经逐步开始赋能各个行业,现在几乎没有哪一个行业不涉及人工智能有关元素。人工智能也在助力各学科的研究,近几年,《自然》等顶级刊物不断刊发人工智能赋能学科的文章,如人工智能推动数学、化学、生物、考古、设计、音乐以及美术等。人工智能内部的学派也在不断交叉融合,像知名的AlphaGo,就是集三大主流学派优势制作,并且现在这种不同学派间取长补短的研究开展得如火如荼。总之,未来的学习、工作与生活中,人工智能赋能的身影将无处不在,因此掌握一定的人工智能知识与技能将大有裨益。
根据笔者长期从事人工智能教学、研究经验来看,一些人对人工智能还存在一定的误区。比如将编程与人工智能直接画上了等号,又或是认为人工智能就只有深度学习等。实际上,人工智能的知识体系十分庞大,内容涵盖相当广泛,不但有逻辑推理、知识工程、搜索算法等相关内容,还涉及机器学习、深度学习以及强化学习等算法模型。当然,了解人工智能的起源与发展、人工智能的道德伦理对正确认识人工智能和树立正确的价值观也是十分必要的。
通过对人工智能及其相关知识的系统学习,可以锻造数学思维(Mathematical Thinking)、逻辑思维(Reasoning Thinking)、计算思维(Computational Thinking)、艺术思维(Artistic Thinking)、创新思维(Innovative Thinking)与数据思维(Data Thinking),即MRCAID。然而遗憾的是,目前市场上既能较综合介绍人工智能相关知识,又能辅以程序代码解决问题,同时还能迅速入门的图书并不多见。因此笔者策划了本系列图书以期实现体系内容较全、配合程序操练及上手简单方便等特点。
本书聚焦情感分析的场景,它是利用人工智能技术挖掘评论人在某些话题中的观点所持态度的一种技术。本书的一大特点是介绍了不同的人工智能技术手段解决情感分析问题,如情感词典、机器学习、深度学习等。第1章介绍什么是情感分析以及情感分析的主要应用场景;第2章介绍分词、建立情感词典以及如何解决情感分析问题;第3章聚焦在文本大数据的收集、整理以及分析,如网络爬虫、文本数据清洗、词频、词云、词袋模型等相关知识;第4章介绍利用朴素贝叶斯、逻辑回归等两种机器学习的算法解决情感分析问题;第5章介绍神经网络在情感分析中的应用;第6章介绍语料库、NPLM模型、Word2Vec模型等相关知识;第7章介绍循环神经网络的工作原理和LSTM模型。同时,在本书的附录部分给出了PyTorch的入门介绍以及概率基础知识回顾。
本书的出版要感谢曾提供热情指导与帮助的院士、教授、中小学教师等专家学者,也要感谢与笔者一起并肩参与写作的其他作者,同时还要感谢化学工业出版社编辑老师们的热情支持与一丝不苟的工作态度。
本书的出版,得到了未来基因(北京)人工智能研究院、腾讯教育、阿里云、科大讯飞等机构给予的大力支持,在此一并表示感谢。
由于笔者水平有限,书中内容不可避免会存在疏漏,欢迎广大读者批评指正并提出宝贵的意见。
龚超
2022年9月于清华大学
|
|