Смешанная символьно-числовая теория возмущений

История вопроса

Symbolics.jl — это быстрая и современная система компьютерной алгебры (CAS), написанная на языке программирования Julia. Она является неотъемлемой частью экосистемы SciML, состоящей из решателей дифференциальных уравнений и пакетов научного машинного обучения. Хотя язык Symbolics.jl в первую очередь предназначен для современных научных вычислений (например, автодифференцирования, машинного обучения), он представляет собой мощную систему CAS, которая может быть полезна и для классических научных вычислений. Одним из таких применений является использование теории возмущений для решения алгебраических и дифференциальных уравнений.

Методы возмущения — это набор способов решения трудных задач, которые, как правило, не имеют замкнутого решения, но зависят от настраиваемого параметра и имеют замкнутые или простые решения при некоторых значениях параметра. Основная идея заключается в том, чтобы представить решение в виде степенного ряда по настраиваемому параметру (скажем, ) так, что соответствует простому решению.

Мы рассмотрим общие этапы применения методов возмущений для решения алгебраических (в этом руководстве) и дифференциальных уравнений.

Отличительной чертой метода возмущений является генерация длинных и запутанных промежуточных уравнений, которые подвергаются алгоритмическим и механическим операциям. Поэтому такие задачи хорошо подходят для CAS. Фактически программные пакеты CAS используются для помощи в расчетах возмущений с начала 1970-х годов.

В этом руководстве мы хотим показать, как использовать сочетание символьных операций (Symbolics.jl) и численных методов для решения простых задач возмущения.

Решение квиники (уравнения пятого порядка)

Начнем с аналога задач возмущения hello world!, решая уравнения пятого порядка. Нам нужно найти вещественное значение , такое, что . Согласно теореме Абеля, общее уравнение пятого порядка не имеет замкнутого решения. Конечно, мы можем легко решить это уравнение численно, например с помощью метода Ньютона. Используем следующую реализацию метода Ньютона.

using Symbolics, SymbolicUtils

function solve_newton(f, x, x₀; abstol=1e-8, maxiter=50)
    xₙ = Float64(x₀)
    fₙ₊₁ = x - f / Symbolics.derivative(f, x)

    for i = 1:maxiter
        xₙ₊₁ = substitute(fₙ₊₁, Dict(x => xₙ))
        if abs(xₙ₊₁ - xₙ) < abstol
            return xₙ₊₁
        else
            xₙ = xₙ₊₁
        end
    end
    return xₙ₊₁
end

solve_newton (generic function with 1 method)

В этом коде Symbolics.derivative(eq, x) делает именно то, что следует из его названия: вычисляет символьную производную eq (выражение Symbolics.jl) по x (переменной Symbolics.jl). Мы используем Symbolics.substitute(eq, D) для определения формулы обновления, подставляя переменные или подвыражения (определенные в словаре D) в eq. Следует отметить, что substitute является исполнительным компонентом нашего кода и будет использоваться много раз в остальных частях этого руководства. solve_newton написан с учетом простоты и ясности, а не производительности.

Вернемся к уравнению пятого порядка. Мы можем определить переменную Symbolics как @variables x, а затем решить уравнение solve_newton(x^5 + x - 1, x, 1.0) (здесь x₀ = 0 — наше первое предположение). Ответ: 0,7549. Теперь посмотрим, как можно решить ту же задачу с помощью методов возмущения.

Вводим в уравнение корректировочный параметр : . Если , мы получаем исходную задачу. При задача преобразуется в простую: , которая имеет точное вещественное решение (и четыре комплексных решения, которые здесь игнорируются). Разложим в виде степенного ряда по :

является решением простого уравнения, поэтому . Подставляем в исходную задачу,

Разложив уравнения, получаем

Это уравнение должно выполняться для каждой степени . Таким образом,

Эта система уравнений изначально не кажется линейной из-за наличия членов типа , но при ближайшем рассмотрении оказывается линейной (это особенность методов возмущений). Кроме того, система имеет треугольную форму, то есть первое уравнение зависит только от , а второе — от и , так что мы можем подставить результат из первого уравнения во второе и удалить нелинейный член. Решив первое уравнение, получим . Подставляем во второе и решаем при :

И, наконец,

При решении исходной задачи получаем , по сравнению с 0,7548, рассчитанным численно. Мы можем повысить точность, включив больше членов в разложение . Однако вычисления, хотя и являются простыми, очень быстро становятся запутанными и трудновыполнимыми для проведения вручную. Вот почему система CAS очень полезна для решения задач возмущения.

Теперь посмотрим, как можно выполнить те же вычисления в Julia. Пусть будет порядком разложения. Начнем с определения символьных переменных:

n = 2
@variables ϵ a[1:n]

2-element Vector{Any}:
 ϵ
  a[1:2]

Затем определим

x = 1 + a[1]*ϵ + a[2]*ϵ^2

1 + a[1]*ϵ + a[2]*(ϵ^2)

Следующим шагом будет подстановка x в уравнение задачи

  eq = x^5 + ϵ*x - 1

-1 + (1 + a[1]*ϵ + a[2]*(ϵ^2))*ϵ + (1 + a[1]*ϵ + a[2]*(ϵ^2))^5

Разложенная форма eq имеет вид

expand(eq)

ϵ + 5a[1]*ϵ + a[1]*(ϵ^2) + 5a[2]*(ϵ^2) + 10(a[1]^2)*(ϵ^2) + a[2]*(ϵ^3) + 20a[1]*a[2]*(ϵ^3) + 10(a[1]^3)*(ϵ^3) + 10(a[2]^2)*(ϵ^4) + 30(a[1]^2)*a[2]*(ϵ^4) + 5(a[1]^4)*(ϵ^4) + 30a[1]*(a[2]^2)*(ϵ^5) + 20(a[1]^3)*a[2]*(ϵ^5) + 10(a[2]^3)*(ϵ^6) + (a[1]^5)*(ϵ^5) + 30(a[1]^2)*(a[2]^2)*(ϵ^6) + 5(a[1]^4)*a[2]*(ϵ^6) + 20a[1]*(a[2]^3)*(ϵ^7) + 10(a[1]^3)*(a[2]^2)*(ϵ^7) + 5(a[2]^4)*(ϵ^8) + 10(a[1]^2)*(a[2]^3)*(ϵ^8) + 5a[1]*(a[2]^4)*(ϵ^9) + (a[2]^5)*(ϵ^10)

Нам нужен способ получения показателей различных степеней ϵ. Функция collect_powers(eq, x, ns) возвращает степени переменной x в выражении eq. Аргумент ns представляет собой диапазон степеней.

function collect_powers(eq, x, ns; max_power=100)
    eq = substitute(expand(eq), Dict(x^j => 0 for j=last(ns)+1:max_power))

    eqs = []
    for i in ns
        powers = Dict(x^j => (i==j ? 1 : 0) for j=1:last(ns))
        push!(eqs, substitute(eq, powers))
    end
    eqs
end

collect_powers (generic function with 1 method)

Чтобы вернуть показатели и в eq, мы можем написать

eqs = collect_powers(eq, ϵ, 1:2)

2-element Vector{Any}:
                 1 + 5a[1]
 a[1] + 5a[2] + 10(a[1]^2)

Несколько слов о том, как работает функция collect_powers. Она использует substitute для нахождения показателя заданной степени x, передавая Dict со всеми степенями x, которым задано значение 0, кроме целевой степени, которой задано значение 1. Например, следующее выражение возвращает показатель ϵ^2 в eq,

substitute(expand(eq), Dict(
  ϵ => 0,
  ϵ^2 => 1,
  ϵ^3 => 0,
  ϵ^4 => 0,
  ϵ^5 => 0,
  ϵ^6 => 0,
  ϵ^7 => 0,
  ϵ^8 => 0)
)

a[1] + 5a[2] + 10(a[1]^2)

Вернемся к задаче. При наличии показателей степеней ϵ мы можем задать каждое уравнение в eqs равным 0 (помните, мы перестроили задачу так, что eq равен 0) и решить систему линейных уравнений, чтобы найти числовые значения показателей. В Symbolics.jl есть функция Symbolics.solve_for, которая может решать системы линейных уравнений. Однако присутствие членов более высокого порядка в eqs препятствует корректной работе Symbolics.solve_for(eqs .~ 0, a). Мы можем воспользоваться тем фактом, что система имеет треугольную форму, и начать с решения eqs[1] при a₁, затем подставить это в eqs[2] и решить при a₂ и так далее. Этот каскадный процесс реализуется с помощью функции solve_coef(eqs, ps):

function solve_coef(eqs, ps)
    vals = Dict()

    for i = 1:length(ps)
        eq = substitute(eqs[i], vals)
        vals[ps[i]] = Symbolics.solve_for(eq ~ 0, ps[i])
    end
    vals
end

solve_coef (generic function with 1 method)

Здесь eqs является массивом выражений (предполагается, что они равны 0), а ps — массивом переменных. В результате получаем словарь пар переменная => значение. Применим solve_coef к eqs, чтобы получить численные значения параметров:

solve_coef(eqs, a)

Dict{Any, Any} with 2 entries:
  a[2] => -0.04
  a[1] => -0.2

Наконец, подставим обратно значения a в определение x как функцию от 𝜀. Обратите внимание, что 𝜀 — это число (обычно Float64), а ϵ — символьная переменная.

X = 𝜀 -> 1 + a[1]*𝜀 + a[2]*𝜀^2

#7 (generic function with 1 method)

Таким образом, решением нашей исходной задачи становится X(1), что равно 0,76. Можно использовать большие значения n, чтобы повысить точность оценок.

n	x
1	0,8
2	0,76
3	0,752
4	0,752
5	0,7533
6	0,7543
7	0,7548
8	0,7550

Помните, что числовое значение равно 0,7549. Во всех примерах этого и следующего руководства используются две функции — collect_powers и solve_coef(eqs, a).

Решение уравнения Кеплера

Исторически методы возмущений были впервые изобретены для выполнения орбитальных расчетов для Луны и планет. Отдавая дань этой истории, наш второй пример связан с космосом. Наша цель — решить уравнение Кеплера:

где — эксцентриситет эллиптической орбиты, — средняя аномалия, а (неизвестно) — эксцентрическая аномалия (угол между положением планеты на эллиптической орбите и точкой периапсиды). Это уравнение является центральным для решения кеплеровских орбит двух тел.

Как и в первом примере, эту задачу легко решить с помощью метода Ньютона. Например, пусть (эксцентриситет Земли) и . solve_newton(x - e*sin(x) - M, x, M) равен 1,5875 (по сравнению с π/2 = 1,5708). Теперь попробуем решить ту же задачу с помощью методов возмущения (см. функцию test_kepler).

При получаем . Поэтому можем использовать в качестве параметра возмущения. Для согласованности с другими задачами также переименуем в , а в .

С этого момента мы используем вспомогательную функцию def_taylor для определения ряда Тейлора, вызывая ее как x = def_taylor(ϵ, a, 1), где аргументами являются, соответственно, переменная возмущения, которая представляет собой массив показателей (начиная с показателя ), и необязательный постоянный член.

def_taylor(x, ps) = sum([a*x^i for (i,a) in enumerate(ps)])
def_taylor(x, ps, p₀) = p₀ + def_taylor(x, ps)

def_taylor (generic function with 2 methods)

Начнем с определения символьных переменных (предполагая, что n = 3):

n = 3
@variables ϵ M a[1:n]
x = def_taylor(ϵ, a, M)

M + a[1]*ϵ + a[2]*(ϵ^2) + a[3]*(ϵ^3)

Еще больше упрощаем задачу, заменяя sin степенным рядом с помощью вспомогательной функции expand_sin:

expand_sin(x, n) = sum([(isodd(k) ? -1 : 1)*(-x)^(2k-1)/factorial(2k-1) for k=1:n])

expand_sin (generic function with 1 method)

Чтобы протестировать,

expand_sin(0.1, 10) ≈ sin(0.1)

true

Уравнение задачи имеет следующий вид:

eq = x - ϵ * expand_sin(x, n) - M

a[1]*ϵ + a[2]*(ϵ^2) + a[3]*(ϵ^3) - (M + a[1]*ϵ + a[2]*(ϵ^2) + a[3]*(ϵ^3) + (1//6)*((-M - a[1]*ϵ - a[2]*(ϵ^2) - a[3]*(ϵ^3))^3) - (1//120)*((-M - a[1]*ϵ - a[2]*(ϵ^2) - a[3]*(ϵ^3))^5))*ϵ

Действуем так же, как и в первом примере. Собираем показатели степеней ϵ

eqs = collect_powers(eq, ϵ, 1:n)

3-element Vector{Any}:
                                                          -M + a[1] + (1//6)*(M^3) - (1//120)*(M^5)
                                              -a[1] + a[2] + (1//2)*(M^2)*a[1] - (1//24)*(M^4)*a[1]
 -a[2] + a[3] + (1//2)*(M^2)*a[2] + (1//2)*M*(a[1]^2) - (1//24)*(M^4)*a[2] - (1//12)*(M^3)*(a[1]^2)

и затем решаем с a:

vals = solve_coef(eqs, a)

Dict{Any, Any} with 3 entries:
  a[2] => M - (1//6)*(M^3) + (1//120)*(M^5) - (1//2)*(M^2)*(M - (1//6)*(M^3) + …
  a[3] => M - (1//6)*(M^3) + (1//120)*(M^5) - (1//2)*(M^2)*(M - (1//6)*(M^3) + …
  a[1] => M - (1//6)*(M^3) + (1//120)*(M^5)

Наконец, подставляем vals обратно в x:

x′ = substitute(x, vals)
X = (𝜀, 𝑀) -> substitute(x′, Dict(ϵ => 𝜀, M => 𝑀))
X(0.01671, π/2)

1.5875853629172587

Результат — 1,5876, по сравнению с числовым значением 1,5875. Принято задавать порядок X на основе степеней 𝑀, а не 𝜀. Мы можем вычислить этот ряд как collect_powers(sol, M, 0:3). Результат (после очистки вручную) таков:

(1 + 𝜀 + 𝜀^2 + 𝜀^3)*𝑀
- (𝜀 + 4*𝜀^2 + 10*𝜀^3)*𝑀^3/6
+ (𝜀 + 16*𝜀^2 + 91*𝜀^3)*𝑀^5/120

Сравнение формулы с формулой для xD835__xDC38 в статье Википедии об уравнении Кеплера:

Первое отклонение — в показателе .