模型驱动的深度学习——模型与数据双驱动的人工智能建模方法 PDF下载

ISBN: 9787508867526

作者:

出版社
科学出版社
出版年
ISBN
9787508867526
装帧
精装
难度等级
进阶
评分
4.0 (豆瓣)

内容简介

核心内容:本书系统地介绍了人工智能建模领域的模型与数据双驱动融合方法与前沿知识
作者背景:作者是计算机视觉与深度学习领域的权威学者,在顶尖研究机构与工业界拥有丰富的研发与项目领导经验
适合人群:已经掌握深度学习基础理论和主流框架使用,想深入研究超越纯数据驱动范式的下一代AI建模方法的读者;需要解决高成本、低可解释性或小样本场景下模型构建实际问题的研究员与算法工程师
独特亮点:首次系统性地提出并梳理了“模型与数据双驱动”的AI方法论框架;提供了从理论到工业级应用的完整技术路径与案例
总体评价:本书由孙剑教授撰写,系统阐述了模型驱动与数据驱动相结合的下一代人工智能建模范式。全书从理论基础出发,深入探讨了如何将先验知识、物理模型与深度学习框架有机融合,以构建更高效、可解释且泛化能力更强的AI系统。内容涵盖模型架构设计、混合建模方法、优化策略以及在计算机视觉、自然语言处理等复杂场景下的应用实践。本书不仅提供了前沿的理论视角,还结合PyTorch、TensorFlow等主流框架给出了大量可复现的代码示例,适合希望突破传统数据驱动范式局限的研究人员与工程师阅读。

PDF版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

内容简介

人工智能与数学、自然科学及工程应用等领域深度交叉融合,正成为推动新一轮科技革命的重要动力.特别是在“AIforScience”的兴起下,人工智能正在从数据驱动向更具模型结构与科学机理的方向扩展,成为科学研究与工程计算的新引擎.《模型驱动的深度学习——模型与数据双驱动的人工智能建模方法》正是在这一趋势下编写而成,系统总结了人工智能与科学问题交叉融合中所涉及的模型与数据双驱动的基础方法,具体介绍了AI与数学优化、统计方法、几何建模、微分方程等关键数学工具的融合路径与方法体系,力求构建一个适用于“AI+科学/工程”交叉研究的理论框架与方法支撑.

目录

目录
《大数据与数据科学专著系列》序
前言
第1章 模型与数据双驱动方法概述 1
1.1 引言 1
1.2 科学建模与计算问题 2
1.2.1 计算成像学 2
1.2.2 预测预报问题 4
1.2.3 科学计算问题 5
1.2.4 图像处理与分析 6
1.3 模型驱动的科学建模与计算方法 7
1.3.1 方程建模方法 8
1.3.2 优化建模方法 9
1.3.3 统计分布建模方法 9
1.3.4 信号处理与分析方法 10
1.4 数据驱动的机器学习建模与计算方法 11
1.4.1 传统机器学习方法 12
1.4.2 深度学习方法 14
1.5 模型与数据双驱动的科学建模与计算方法 20
1.5.1 模型与数据双驱动的基本思路 20
1.5.2 模型与数据双驱动的建模优势 22
1.5.3 典型领域中的模型与数据双驱动建模方法 23
1.5.4 本书的组织结构 24
第2章 优化模型驱动的深度学习方法 27
2.1 引言 27
2.2 典型优化模型与算法简介 28
2.2.1 典型优化模型 28
2.2.2 典型优化算法 28
2.2.3 优化方法与深度学习方法的结合 32
2.3 优化模型驱动的深度学习模型设计 33
2.3.1 双层优化问题 33
2.3.2 基于学习的稀疏编码模型求解 36
2.3.3 反问题建模与求解的模型驱动深度网络 38
2.4 基于深度学习的优化算法学习方法 47
2.4.1 基于深度学习的优化方法 48
2.4.2 优化模型驱动的优化策略学习 51
2.5 总结与展望 57
第3章 统计模型驱动的深度学习方法 59
3.1 引言 59
3.1.1 统计学与统计机器学习的一些基本概念 59
3.1.2 统计与深度机器学习 60
3.2 基于变分自编码的统计分布建模 62
3.2.1 变分推断基本原理 62
3.2.2 变分自编码模型与训练方法 63
3.2.3 变分自编码的应用 65
3.3 基于流模型的分布估计深度学习模型 66
3.3.1 基于可逆深度网络的分布估计 66
3.3.2 基于连续流模型的分布估计 71
3.3.3 正规流模型的典型应用 75
3.4 基于Wasserstein距离的生成对抗统计分布建模 79
3.4.1 Wasserstein距离简介 79
3.4.2 Wasserstein距离导出生成对抗网络 80
3.4.3 Wasserstein生成对抗网络应用 81
3.5 基于概率密度对数梯度估计的生成模型 83
3.5.1 打分模型基本原理 83
3.5.2 基于随机微分方程的概率密度估计模型 86
3.5.3 去噪扩散概率模型 87
3.5.4 隐扩散去噪模型 92
3.5.5 基于扩散模型的图像重建和图像恢复 94
3.6 总结与展望 96
第4章 几何模型驱动的深度学习方法 100
4.1 引言 101
4.2 流形上的深度学习 103
4.2.1 流形的基本定义 103
4.2.2 流形上的一般深度学习框架 105
4.3 群等变深度神经网络 113
4.3.1 群等变深度神经网络基础 113
4.3.2 典型对称群定义 116
4.3.3 群等变深度网络的典型应用 117
4.4 点云或图上等变神经网络 118
4.4.1 基于向量神经元的等变神经网络 118
4.4.2 基于标架平均的等变神经网络 121
4.4.3 基于不可约表示的等变Transformer网络 126
4.4.4 等变图/点云深度网络应用 129
4.5 总结与展望 130
4.5.1 总结 130
4.5.2 展望 130
第5章 微分方程建模与求解的深度学习方法 133
5.1 引言 133
5.2 基于深度学习的微分方程建模 134
5.2.1 基于符号回归的微分方程搜索 135
5.2.2 非线性动力系统的稀疏发现 137
5.2.3 微分方程的神经网络逼近学习 140
5.3 基于深度学习的微分方程求解 144
5.3.1 物理信息神经网络求解偏微分方程 144
5.3.2 神经算子求解偏微分方程 146
5.4 基于学习的反问题建模与求解 153
5.4.1 伴随方程方法 154
5.4.2 神经网络代理函数方法 156
5.4.3 其他的反问题求解方法 158
5.5 总结与展望 162
5.5.1 总结 162
5.5.2 展望:工业软件设计中的高效、高精度算法 162
5.5.3 展望:天气预测、疾病演化等大规模系统建模与计算 163
5.5.4 展望:更加通用的PDE建模与计算的人工智能基座模型 164
第6章 结语与展望 165
6.1 结语 165
6.2 展望 166
6.2.1 从模型-数据双驱动到模型-数据-生成三驱动 166
6.2.2 深度学习中的更有效物理机制融入建模 167
6.2.3 面向科学建模与计算的人工智能底座大模型 168
6.2.4 AI for X中的大量建模与应用问题 169
参考文献 171
《大数据与数据科学专著系列》已出版书目 185

精彩书摘

第1章模型与数据双驱动方法概述
  1.1引言
  科学建模与计算是现代科技发展的核心推动力之一,涵盖了信号处理、成像科学、生命科学、材料科学、社会科学等众多领域。其本质在于将复杂的物理、化学、生物或社会现象抽象为数学模型,并设计高效的计算方法解决实际问题。科学建模与计算的目标有两方面:一是通过数学建模与计算揭示和描述客观世界中的规律;二是在这些规律的基础上,进行复杂环境和变化场景下的现象预测与关键因素的识别。
  传统方法的科学建模与算法方法以模型驱动为核心。具体地,模型驱动的方法以物理、化学和生物等领域中的特定理论为基础,通过构建数学模型来描述和模拟各类现象、结构、趋势等,典型方向包括:(1)反问题求解,即从观测数据推导出系统的内在参数或状态,例如通过X射线断层成像重建三维结构;(2)图像处理与分析,即在利用数学模型和算法对图像进行分层和分析,例如,图像重建、图像理解等;(3)微分方程建模方法,即描述时间和空间上的连续变化过程,广泛应用于动力系统、传热、流体动力学等领域;(4)信号处理与分析方法,即通过滤波、变换等技术分析和处理信号,例如傅里叶变换、小波变换等;(5)工程优化建模方法,即将工程问题与工程问题抽象为数学模型,并基于*优化理论和算法实现,充分体现了模型驱动在科学建模中的主导作用,即以模型为核心,通过计算实现对各类研究对象的理解、描述和优化。
  随着各类传感器和数据采集手段的迅猛发展,大量数据不断涌现,数据驱动的方法逐渐成为科学建模与计算的重要方向。数据驱动的方法通过大数据和机器学习技术,从数据中自动学习模型,而非依赖物理定律或先验假设,主要任务包括:(1)自动化特征提取,即利用数据挖掘和深度学习算法,从数据中自动提取有效特征;(2)数据分析与预测,即通过机器学习模型(如神经网络、随机森林)对数据进行分析和预测,这些数据驱动的机器学习模型不依赖于对问题本质规律的数学建模,而是主要以数据为驱动的神经网络等机器学习模型对问题进行建模和分析。
  模型与数据双驱动的人工智能建模方法是结合模型驱动和数据驱动两者优势的一种方法论。具体而言,它是结合传统机理模型优势和数据驱动机器学习优势的一种混合建模方法,其可通过数据驱动自适应确定机理模型的不确定性因素,也可反之通过机理建模融入实际问题模型与背景。该方法通常应用于以下场景:(1)混合建模,即结合物理模型与数据模型,对复杂系统进行更精确的描述;(2)模型校正,即利用数据驱动的方法对传统模型进行参数校准和改进;(3)智能预测,即在有物理模型约束的前提下,利用数据驱动方法提升预测的精度。结合模型驱动与数据驱动的双驱动方法可以在模型不完备、数据有限或两者不一致的情况下,找到更为优化的解决方案,这为科学研究和工程应用提供了强大的工具和新思路。
  下面将系统介绍科学建模与计算、数据驱动的机器学习(尤其深度学习)等传统方法的发展与研究进展,*后系统引出模型与数据双驱动建模方式的基本思路和方法,目的是为本书系统介绍模型与数据双驱动的建模与计算方法提供基本背景以及理论与方法基础。
  1.2科学建模与计算问题
  科学建模与计算是现代科技发展的重要推动力,其核心在于通过将复杂的自然、社会、工程现象抽象为数学模型,并借助高效的计算方法解决实际问题。这一研究领域涉及众多研究问题,涵盖了从理论研究到应用开发的各个方面。以下将以计算成像学、预测预报问题、科学计算、图像处理与分析为典型例子,介绍科学建模与计算的背景和方法。
  1.2.1计算成像学
  计算成像学(Computational Imaging)是一个基于物理成像设备观测到的数据,利用成像算法进行间接成像的研究方向。不同于传统的基于光学成像系统的“可见即可得”的成像方法,计算成像学更加关注将采集设备与高性能计算融为一体进行数字化成像。随着高性能计算设备(例如多核CPU、GPU等)的快速发展,现代科学建模与计算、机器学习算法与感知计算深度结合,对提高成像的广度、精度、质量、速度等性能带来了显著的提升。计算成像学已经被广泛应用于计算显微成像(Computational Microscopy)、计算层析成像(Computational Tomographic Imaging)、快速磁共振成像(FastMagnetic Resonance Imaging)、合成孔径雷达成像(Synthetic Aperture Radar Imaging)、地震成像(Seismic Imaging)、计算摄影学(Computational Photography)等。
  医学图像重建:医学成像是一种典型的计算成像方法,是观测体内影像以方便进行临床诊断分析与医疗干预治疗的方法。医学成像是生物成像学和放射学的交叉方向,典型成像技术包含X射线成像、磁共振成像、超声成像、核医学功能成像(正电子发射断层扫描(Positron Emission Tomography,PET)、单光子发射计算机断层扫描)等。现代医学成像方法特别依赖于对成像机制的科学建模与计算,可以说成像的关键在于复杂的数据建模与重建算法。例如,计算机断层扫描(Computed Tomography,CT)成像技术利用多角度X光射线穿过人体不同组织,射线在穿透过程中产生强度衰减并被采集,进而构成弦图;磁共振(Magnetic Resonance,MR)成像技术通过外部施加磁场引起人体内氢原子核发生旋转,人体不同器官与病变组织在磁共振过程中产生不同磁共振信号并被记录,进而构成k-空间数据。CT和MR成像算法的主要任务是从观测到的弦图和k-空间数据重建出反映人体内部结构的影像。
  压缩感知(Compressive Sensing,CS)成像:为突破信号采集的奈奎斯特率局限,Donoho提出将信号采集(即感知)与信号重建联合,其主要原理是基于局部信号的稀疏特性,从少量采样信号(低于奈奎斯特采样定理要求)重建出高质量的信号。传统的信号处理领域关注从采样数据重建出信号。关于信号处理的一个重要的理论基础是奈奎斯特-香农采样定律(Nyquist–Shannon Sampling Theorem),该定律说明当真实信号的*高频率小于信号采样率的一半时,信号可以被完全恢复。2004年,Candes等在文献[24]中证明:基于信号的稀疏性特性,信号可以低于奈奎斯特-香农采样定律要求的采样频率进行恢复,开辟了压缩感知的研究新方向。压缩感知成像的基本公式:
  其中,是压缩感知观测矩阵,决定信号如何采样,即将高维信号投影到低维空间;是信号的稀疏基矩阵,是感知矩阵(Sensing Matrix)。压缩感知反问题的目的是从观测信号重。Candes和Tao于2005年提出观测矩阵的限制等距性(Restricted Isometry Property,RIP)条件:对于任意稀疏向量(即该向量*多含有个非零值),满足存在等距常数使得
  则满足阶RIP条件。可以证明$K$-稀疏向量可以被完全恢复,如果满足RIP条件且。
  地球物理反问题:地球物理的另一个基本问题是如何基于地球表面附近的观测数据来推断地球的内部结构。由于观测数据往往是有限的,且这些数据与地球内部结构的关系通常是间接且复杂的,因此地球物理反问题成为该领域的重要基础问题。地球物理学主要研究不同物理场(例如重力场、电磁场、地震波场)的行为,这些物理场的观测数据依赖于地球内部的岩石结构和其他物质特性。在研究地球物理问题时,前向问题涉及基于参数化的地球物理模型生成数据:
  其中,表示地球物理模型,为模型参数,为基于模型生成的数据,是噪声项。地球物理反问题则研究如何优化地球物理模型参数,使得模型生成的数据与观测数据一致,通常,通过以下优化问题建模:
  其中为正则项,为正则项系数。例如,针对没有密度变化的声波波动方程:
  其中是波速度模型,是外界干扰源函数。在优化问题中,地球模型参数代表,代表求解声波波动方程的非线性变换,为噪声。这种方法论在传统地球物理反问题中得到广泛应用,还可结合深度学习技术,进一步提升计算效率和结果的准确性。
  1.2.2预测预报问题
  预测预报的目的是基于观测到的历史数据预测未来事件发生的可能性,或进一步分析决定未来事件的关键因素。预测预报问题被广泛应用于不同领域,例如医学疾病愈后预测、天气预报、海洋洋流走势预报以及疾病关键影响基因发现等。在新型冠状病毒(COVID-19)暴发后,为了降低医疗系统的压力,快速预测个体感染病毒的风险至关重要,这有助于实现病毒感染的快速筛查。基于机器学习的方法可以迅速发现与病毒感染相关的关键预测因素,包括年龄、性别、与感染个体的接触以及其他初始临床症状。在自动驾驶领域,预测道路上行人和各种运动物体的运动轨迹对于驾驶轨迹规划或障碍物的安全避让具有重要意义。预测预报问题的方法包括统计回归方法、动力系统建模方法以及基于机器学习的方法。
  统计回归方法主要通过建立变量之间的数学模型来进行预测,常见的回归方法包括线性回归、岭回归和Lasso回归等。这些方法的核心思想是通过对历史数据的拟合建立预测模型,并利用模型对未来数据进行预测。典型的预测模型如下:
  其中,$F_\theta(\boldsymbol{X}_i)$是预测函数,通常可取为线性形式,是正则项,例如Lasso约束,它通过对组合系数$\alpha_t$施加约束来控制模型的复杂度,有助于提高模型的泛化能力,避免过拟合,并且可以用于识别重要的预测因子。
  动力系统建模方法通过建立动态模型来描述随时间变化的规律,这些方法用于模拟和预测随时间变化的动态行为,广泛应用于物理、生物、经济系统等领域。常见模型包括常微分方程(Ordinary Differential Equation,ODE)和偏微分方程(Partial Differential Equation,PDE)。常微分方程用于描述单一变量的动态变化,而偏微分方程用于描述涉及多个空间和时间变量的动态系统。基于动力系统的方法常用方程为:
  其中为模型参数,描述了系统状态随时间的变化规律。
  基于机器学习的方法通过构建复杂的模型来捕捉数据中的非线性关系和模式,机器学习方法包括监督学习、无监督学习和强化学习等。在预测预报问题中,数据和复杂的特征交互的模型是机器学习方法提升预测性能的核心。机器学习方法包括支持向量机、随机森林和深度学习等,常用预测模型包括神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN),也被广泛应用于处理序列数据和图像数据。特别地,长短期记忆(LongShort-Term Memory,LSTM)和Transformer在预测问题中表现出色,因为它们能够有效捕捉长期依赖关系。基于机器学习的方法的优点在于能够通过大量数据自动发现模式,并且具有较强的自适应能力,能够在面对复杂和动态变化的环境时做出有效预测。比如,在疾病预测中,机器学习算法可以通过分析患者的健康记录、基因信息和生活习惯等多方面数据,准确预测疾病的发生概率。
  不同的预测预报方法各有其优缺点和适用场景。统计回归方法在数据关系相对简单且线性时表现优良,但在处理复杂非线性关系时可能效果不佳。动力系统建模方法适合描述物理系统和自然现象的动态变化,但需要对系统的物理过程有较好的了解,但可能需要大量的数据和计算资源。在实际应用中,选择具有较强的泛化能力、基于机器学习的方法能够处理复杂的非线性关系,并且具有较强的泛化能力,具体问题的特点、数据的性质以及计算资源的限制,在许多情况下,结合多种方法的优点可以获得更为准确和可靠的预测结果。
  1.2.3科学计算问题
  科学计算(Scientific Computing)是一个跨学科领域,专注于通过数学建模、定量分析以及利用计算

✍️ 发表您的评价

5.0分
0/500
验证码