首页

《大数据数学基础(Python 语言描述)》
是一本聚焦大数据领域核心数学知识,并通过 Python 编程实践帮助读者理解与应用的教材。
其核心价值在于打破 “纯数学理论” 与 “纯编程工具” 的割裂,
将大数据技术(如数据分析、机器学习、数据挖掘)依赖的数学原理与 Python 实现紧密结合,
适合作为大数据、人工智能入门者的基础工具书。
BP 神经网络,一种模拟人类大脑神经元工作方式的模型;
大脑中有无数的神经元,它们相互连接,通过传递信号来处理信息;
BP 神经网络也是由许多神经元组成,这些神经元按照层次排列,分为输入层、隐藏层和输出层;
神经元之间通过权重来传递信息,每个连接都有一个权重值,这个权重值决定了信息传递的强度。
就好比一条道路,有的道路宽阔平坦,车辆通行顺畅,权重就大;
有的道路狭窄崎岖,车辆通行困难,权重就小;
在 BP 神经网络中,权重的大小会影响信息在神经元之间传递的效果;
BP 算法  反向传播算法,  Backpropagation Algorithm ;
当输入层接收到信息后,信息会通过权重传递到隐藏层的神经元,
隐藏层的神经元对信息进行处理后,再传递到输出层。
输出层得到结果后,会与期望的正确结果进行比较,计算出误差;
然后,误差会从输出层反向传播回隐藏层和输入层,通过调整权重来减小误差;
这个过程会不断重复,直到误差达到可以接受的范围;
常用的误差计算方法 均方误差;
将文字转换成向量
独热编码
美丽的花朵在风中摇曳
假设词汇表,总共有 5 个词
‘美丽’   ‘花朵’   ‘在’    ‘风中’    ‘摇曳’
‘美丽’这个词的独热编码就可以表示为 [1, 0, 0, 0, 0],
其中只有对应‘美丽’这个词位置的数字是 1,其他位置都是 0;
‘花朵’的独热编码就是 [0, 1, 0, 0, 0]
如果词汇表非常大,每个向量都会有很多 0,会浪费很多空间;
词嵌入是一种将词语映射到低维实数向量空间的技术,
通过训练模型,让每个词都能在这个空间中找到一个合适的位置,
使得语义相近的词在向量空间中的距离也相近。
在某向量空间里,‘汽车’和‘卡车’这两个词的向量就会比较接近,因为它们都属于交通工具这一类,语义相近。
而‘汽车’和‘花朵’的向量就会相距很远,因为它们的语义差异很大。
通过计算向量之间的距离来理解词语之间的关系了
深度学习是一种通过多层神经网络自动学习特征表示的机器学习方法;
它还有一个非常重要的特点——不需要再提取特征了
《超有趣的GPT AI公子逆袭记》
AI(Artificial Intelligence,人工智能)是如何拥有创造力的?
图像和文本生成如何做到以假乱真?
什么是 ChatGPT? 
人工智能的未来会怎样?
这些问题都会在这个有趣的故事中被一一解答。
本书讲述了AI公子为了在心爱的千金小姐的招亲大会中获胜而努力学习的幽默故事。
本书讨论了AI 与人类学习的相似性,结合AI公子的学习过程讲述ChatGPT核心技术的发展脉络。 
本书适合对ChatGPT感兴趣的人员阅读
《大模型实战:微调、优化与私有化部署》
本书深入浅出地介绍了现代大型人工智能(Artificial Intelligence,AI)模型技术,
从对话机器人的发展历程和人工智能的理念出发,详细阐述了大模型私有化部署过程,
深入剖析了Transformer架构,旨在帮助读者领悟大模型的核心原理和技术细节。 
本书的讲解风格独树一帜,将深奥的技术术语转化为简洁明了的语言,
案例叙述既严谨又充满趣味,让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI知识。
本书提供完整的代码示例,可帮助读者将抽象的理论知识转化为手头的实际技能。
本书不仅理论知识丰富,实战案例更能帮助读者在专业领域内高效地应用AI技术。
ChatGLM3 
是由智谱 AI 训练的第三代大型语言模型,它不仅能理解和生成人类语言,还能执行代码、调用工具,并以 markdown 格式输出结果。
ChatGLM3-6B 中的 “6B” 表示该模型大约具有 60 亿个参数
B  billion 十亿
在人工智能领域,参数数量是衡量深度学习模型规模和复杂性的关键指标
当前大模型四大热门方向:
预训练、模型微调、AI Agent和提示工程
ChatGPT:一种基于深度学习的对话生成模型;
Stable Diffusion:一种用于生成高质量图像的技术
弱人工智能(Narrow AI) 与 强人工智能(General AI)

第一页 上一页 下一页 最后一页