牛顿处理不了的问题AI或许能搞定用神经网络处理三体问题

放大字体  缩小字体 发布时间:2019-11-02 20:27:28  阅读:9767+ 作者:责任编辑NO。许安怡0216

选自 arXiv-vanity

作者:Philip G. Breen等

机器之心编译

参加:魔王

许多闻名科学家为三体问题绞尽脑汁,其面对多种复杂情况,核算本钱也很高。最近的一项研讨提出运用深度神经网络处理三体问题,其均匀速度是当时最优求解器的 105 倍,最快速度可达后者的 1 亿倍。

三体问题(Three-body problem)是天体力学中的根本力学模型。它是指三个质量、初始方位和初始速度都是恣意的可视为质点的天体,在相互之间万有引力的效果下的运动规则问题。

艾萨克·牛顿爵士在 1687 年出书的《自然哲学的数学原理》一书中初次提出了三体问题的完好数学描绘,但是自那之后,对三个问题的运动方程求解仍是待解难题。现在,关于给定初始化,咱们只能经过许多费时吃力的迭代核算求解,且由于体系的混沌特点,这些核算的本钱很高且难以预测。

来自爱丁堡大学、剑桥大学等组织的研讨者运用恣意精度数值积分器(可用于练习深度神经网络)在有限时刻内取得多个解,该办法以固定核算本钱核算出精确的解,且最快核算速度可达当时最优求解器的 1 亿倍。该成果表明,关于相空间中有核算难度的区域而言,神经网络能够代替现有的数值求解器,完成多天体体系的快速和可扩展模仿,然后解说双黑洞体系或稠密星团中核坍缩的来源等现象。

论文衔接:https:///papers/1910.07291/

三体问题有多难?

牛顿的运动方程描绘了空间内多个天体在本身引力效果下的演化,这些方程关于许多物理学经典问题起到重要效果。例如,这些方程解说了球状星团和星系核的动态演化,而星系核被认为是双黑洞严密捆绑在一起并终究构成引力波的当地。

许多闻名科学家对此问题支付许多时刻、爱好和精力,但由于体系的混沌特点,对三体问题的运动方程求解仍然是待解难题。混沌特点一般意味着只要经过许多繁琐的数值积分才干得到可行解。解析解仅存在于几个特例中,Valtonen 等人在 2016 年提出了三体问题的通解,但该解依据无量级数打开(infinite series expansion),且在实践中运用有限。

神经网络 vs 三体问题

来自爱丁堡大学、剑桥大学等组织的研讨者进行的这项新研讨新颖之处在于,在固定时刻内,运用多层深度神经网络处理有 300 多年前史的三体问题。其原理验证办法证明,在有核算难度的场景中,如屡次密切触摸(close encounter),神经网络能够精确匹配恣意精度数值积分器的成果,而它所用的时刻和碳本钱仅仅后者的一部分。

具体办法

针对混沌问题练习人工神经网络需求集成多个不同初始化的解。获取此类练习集的仅有方法是,对许多不同完成的运动方程履行数值积分直到取得收敛解,这儿研讨者运用 Brutus(一种恣意精度 N 体数值积分器)。

研讨者将练习集约束在同一平面内三个初始速度为零的等质质点的引力问题。这三个质点的笛卡尔坐标别离为 x_1、x_2、x_3,初始方位是:x_1≡(1,0),(x_2,x_3) 坐落 x 轴负方向(即 x≤0)单位半圆中的随机方位。在该体系中,仅需求指定 (x_2,x_3) 的初始方位,由于剩下一个质点的方位能够依据对称性推导得出。

此外,研讨者运用无量纲单位 G=1。该物理设置答应用 2 个参数描绘初始条件,用 3 个参数描绘体系演化(表明 x_1 和 x_2 在给定时刻的坐标)。将这个三维相空间(时刻 t 和 x_2 的初始坐标)映射至质点 x_1 和 x_2 的方位,即可得到通解,而质点 x_3 的方位能够依据对称性得到。

图 1:初始质点方位的可视化图示。

数据

练习集和验证集别离包括 9900 和 100 个模仿。在每个模仿中,研讨者运用 Brutus 对运动方程履行数值积分,然后随机生成质点的初始方位和核算轨道,这一般适用于多达 10 个时刻单位(每个时刻单位大约是一个动态相遇时标(crossing time)。每条轨道由约 2561 个离散时刻点(标签)构成。

研讨者运用包括 10 个躲藏层、128 个互联节点的前馈神经网络(见图 2 和附录 B)。经过自适应矩估量优化算法 ADAM 履行练习,练习过程中对数据履行了 10000 次传输,每个 epoch 被分割为多个 batch,batch 巨细为 5000,ReLU 激活函数被设置为 max(0,x)。

向输入层输入时刻 t 和质点 x_2 的初始方位,神经网络将回来 x_1 和 x_2 在时刻 t 的方位,然后迫临通用三体问题的潜在解析解。

图 2:牛顿和本研讨提出的深度神经网络。

成果

为了测验该神经网络在不同时刻段中的功能,研讨者将练习数据集和验证数据集分割为三个部分:t 3.9、t 7.8 和 t 10(均包括一切数据)。功能最好的神经网络是运用来自 t 3.9 的数据练习得到的(见图 3)。

图 3:均匀绝对误差(MAE)vs epoch。

该神经网络在一切练习未见过场景中的功能堪比收敛解。此外,神经网络在固定核算时刻(t 10^ 3 秒)内取得这样的功能,均匀速度是 Brutus 的 105 倍(有时乃至能够到达 108 倍)。

机器之心「SOTA模型」22大范畴、127个使命,机器学习 SOTA 研讨一扫而光。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!