Moduł 03 · numeryczne

Metody Jakobianowe

Jacobian Transpose, pseudoinwersja, Damped Least Squares, SDLS.

Dlaczego nie zamkniętą formułą?

Metoda analityczna (moduły 1–2) daje dokładne rozwiązanie i jest właściwym wyborem, gdy znamy zamkniętą formę dla danej geometrii, np. Puma 560 (forma A Piepera) czy UR5 (forma B). Schody zaczynają się gdy: (a) manipulator ma 7+ DOF, wtedy IK ma nieskończenie wiele rozwiązań i potrzeba dodatkowych kryteriów (Franka Panda, KUKA LBR iiwa); (b) używamy nietypowej geometrii bez gotowego wyprowadzenia, roboty chirurgiczne, prototypy, custom mechanizmy; (c) uczenie się dynamicznie zmienia model (np. estymacja online długości ogniw przy soft-robotach).

Dla typowych przemysłowych 6-DOF rozwiązanie zamknięte zawsze istnieje (Raghavan–Roth dowodzą, że dowolny 6-DOF ma co najwyżej 16 rzeczywistych rozwiązań i wszystkie da się wyznaczyć analitycznie), ale w praktyce jego wyprowadzenie bywa pracochłonne. Solvery numeryczne dają rozwiązanie „od ręki" dla dowolnej geometrii podanej tabelą DH, bez ręcznej algebry, bez zgadywania struktury wzorów. To czyni je domyślną opcją w prototypowaniu.

Potrzebujemy więc solverów numerycznych, działających dla dowolnego manipulatora, nawet jeśli równania są nieliniowe w sposób, który uniemożliwia ich odwrócenie ręcznie. Wszystkie metody tego modułu oparte są na jednym pomyśle: linearyzacji przez Jakobian.

Intuicja: metoda Newtona w jednym wymiarze

Zanim przejdziemy do przestrzeni konfiguracji 6-DOF, popatrzmy na analogiczny problem w 1D. Chcemy rozwiązać równanie $f(x) = 0$ dla pewnej gładkiej, nieliniowej funkcji $f$ . Bez zamkniętej formuły, używamy metody Newtona–Raphsona:

Zgadujemy startową wartość $x_0$ .
Liczymy styczną do wykresu w punkcie $(x_0, f(x_0))$ .
Przedłużamy styczną do przecięcia z osią X, nowe przybliżenie $x_1 = x_0 - f(x_0)/f'(x_0)$ .
Powtarzamy: $x_2$ ze stycznej w $x_1$ , i tak dalej.

Każda kolejna styczna „lepiej się dopasowuje" do miejsca zerowego $x^*$ . Po kilku iteracjach osiągamy dowolną precyzję:

Kluczowe spostrzeżenie: w jednym kroku nie próbujemy od razu trafić w rozwiązanie. Zamiast tego zastępujemy trudną, nieliniową funkcję $f$ jej łatwą, liniową aproksymacją (styczną) i rozwiązujemy problem liniowy, który umiemy. Dopiero powtarzanie tego schematu doprowadza nas do celu.

Czym właściwie jest Jakobian?

W 1D rolę „wrażliwości" wyjścia na wejście pełni pochodna $f'(x)$ . Mówi ona: „jeżeli zmienię $x$ o jednostkę, to $y = f(x)$ zmieni się w przybliżeniu o $f'(x)$ jednostek". W robotyce mamy wejście $q = (q_1, \dots, q_n)$ (kąty przegubów) i wyjście $\xi = (v_x, v_y, v_z, \omega_x, \omega_y, \omega_z)$ (prędkość liniowa i kątowa końcówki), sześć liczb wyjścia, n liczb wejścia. „Pochodna" takiego odwzorowania to macierz, właśnie Jakobian $J(q) \in \mathbb{R}^{6 \times n}$ :

J(q) \;=\; \begin{bmatrix} \dfrac{\partial v_x}{\partial q_1} & \cdots & \dfrac{\partial v_x}{\partial q_n} \\[2pt] \vdots & \ddots & \vdots \\[2pt] \dfrac{\partial \omega_z}{\partial q_1} & \cdots & \dfrac{\partial \omega_z}{\partial q_n} \end{bmatrix}

Wiersze macierzy odpowiadają sześciu składowym prędkości końcówki (3 translacyjne + 3 obrotowe). Kolumny macierzy odpowiadają poszczególnym przegubom, każda kolumna $J_i$ mówi, jak jednostkowa prędkość i-tego przegubu wpływa na końcówkę:

Innymi słowy: wyobraź sobie, że obracasz tylko jeden przegub, resztę trzymasz nieruchomo. Końcówka zakreśla łuk, lokalnie wektor jej prędkości to właśnie kolumna Jakobianu odpowiadająca temu przegubowi. Jeśli wszystkie przeguby obracają się jednocześnie, ich wkłady się dodają liniowo (bo różniczkowanie jest liniowe):

\xi \;=\; J_1(q)\,\dot q_1 + J_2(q)\,\dot q_2 + \cdots + J_n(q)\,\dot q_n \;=\; J(q)\,\dot q

Trzy kluczowe rzeczy do zapamiętania o Jakobianie:

Jakobian zależy od $q$ . To nie jest „stała macierz robota", to pochodna cząstkowa w konkretnym punkcie. Gdy zmieniasz konfigurację, Jakobian się zmienia. Stąd w pętli iteracyjnej musimy go przeliczać za każdym razem.
Jakobian łączy prędkości, nie pozycje. Relacja $\xi = J\dot q$ jest między prędkością końcówki a prędkościami przegubów. Dla małych przyrostów (lokalnie) mamy $\Delta x \approx J \, \Delta q$ , stąd iteracyjne rozwiązanie IK.
Dla przegubów obrotowych istnieje jawny wzór. Nie trzeba różniczkować symbolicznie, kolumnę $J_i$ można zapisać geometrycznie (zobacz StepPanel 1 niżej): wkład do prędkości liniowej końcówki to $\hat{\mathbf{z}}_i \times (\mathbf{p}_\text{ee} - \mathbf{p}_i)$ (iloczyn wektorowy osi obrotu z wektorem „promień od osi do końcówki"); wkład do prędkości kątowej, to sama oś $\hat{\mathbf{z}}_i$ . Dla przegubu przesuwnego jest jeszcze prościej: tylko wkład liniowy $\hat{\mathbf{z}}_i$ , zero wkładu kątowego.

Newton w 6 wymiarach, powrót do IK

Teraz łączymy obie intuicje. W IK rozwiązujemy $\mathbf{F}(q) = \mathbf{0}$ , gdzie $\mathbf{F}(q) = T^{*} \ominus f(q)$ jest wektorowym błędem pozy (6-wymiarowym, translacja + rotacja). W metodzie Newtona rolę „dzielenia przez pochodną" (z 1D) pełni pseudoinwersja Jakobianu $J^\dagger$ :

\underbrace{x_{k+1} = x_k - \frac{f(x_k)}{f'(x_k)}}_{\text{1D Newton}} \quad\longrightarrow\quad \underbrace{q_{k+1} = q_k + J^{\dagger}(q_k)\,\mathbf{e}(q_k)}_{\text{6D Newton dla IK}}

(znak się odwraca, bo definiujemy błąd jako $\mathbf{e} = T^* \ominus f(q)$ , nie $f(q) - T^*$ , ale struktura kroku jest identyczna). Resztę wariantów, Jacobian Transpose, DLS, Adaptive DLS, zobaczymy niżej jako modyfikacje tego samego kroku, różnie radzące sobie z trudnościami, gdy Jakobian jest źle uwarunkowany.

Anatomia pojedynczej iteracji

Pojedyncza iteracja solvera Jakobianowego to pięć etapów wykonywanych w stałej kolejności. Po piątym sprawdzamy warunek stopu i albo kończymy, albo wracamy do pierwszego z nową wartością $q$ :

Zauważ: $J$ liczymy od nowa w każdej iteracji, bo zależy od aktualnego $q_k$ . To nie jest „statyczna macierz robota"; to pochodna cząstkowa wyliczana w bieżącym punkcie przestrzeni konfiguracji. Gdyby FK była liniowa, wystarczyłaby jedna iteracja (tak jak Newton na funkcji liniowej trafia w zero od razu). FK jest silnie nieliniowe, stąd konieczność pętli.

Pseudokod

q ← q_seed              // zgadnięta/znana konfiguracja startowa
for k = 0, 1, 2, … do
    T_k ← FK(q)                            // 1. FK
    e_k ← twist_error(T_k, T_target)       // 2. błąd w SE(3)
    if  ‖e_k‖  <  ε  then  return  q       //    warunek stopu
    J_k ← jacobian(q)                      // 3. jakobian w aktualnym punkcie
    Δq  ← solve_step(J_k, e_k, method)     // 4. krok (Transpose / Pinv / DLS / SDLS)
    q   ← q + α · Δq                       // 5. aktualizacja (α = step size)
end for
return  q  // osiągnięto limit iteracji bez zbieżności

Klucz do zrozumienia, dwa poziomy „nieliniowości"

Zewnętrzna pętla po iteracjach, to ta, która pozwala nam pokonać nieliniowość FK. Po każdym kroku linearyzujemy od nowa w nowym punkcie $q_k$ .
Wewnętrzny krok liniowy, rozwiązujemy układ $J\,\Delta q = e$ . To jest łatwe (algebra liniowa), ale wrażliwe: przy złym uwarunkowaniu $J$ krok staje się ogromny, a wtedy punkt $q_{k+1}$ wylatuje poza obszar, w którym linearyzacja obowiązywała. Stąd modyfikacje, tłumienie, ograniczanie kroku, które poznamy dalej.

Co oznacza „zbieżność" i kiedy jej brak

Zbieżność to spadek normy błędu $\|\mathbf{e}_k\|$ do zera. W dobrym przypadku spadek jest kwadratowy (przy pełnym Newtonie i pseudoinwersji w okolicy rozwiązania): błąd w iteracji $k+1$ jest proporcjonalny do kwadratu błędu w iteracji $k$ . Oznacza to, że liczba cyfr dokładnych się podwaja z każdym krokiem.

Co może pójść nie tak:

Rozbieżność, gdy krok $\Delta q$ jest za duży (np. w pobliżu singularności $J$ źle uwarunkowana), $q_{k+1}$ skacze do obszaru, gdzie linearyzacja już nie ma sensu. Kolejne iteracje pogłębiają problem. Ratunek: tłumienie (DLS) albo line-search.
Oscylacje, solver oscyluje w okolicy rozwiązania zamiast w nie wchodzić. Typowe dla Jacobian Transpose ze zbyt dużym $\alpha$ albo dla metod bez adaptacyjnego kroku.
Stagnacja, krok staje się mikroskopijny (np. $J^\top \mathbf{e} \approx 0$ gdy Transpose trafi w lokalny pseudominimalny punkt). Solver „utyka" bez osiągnięcia tolerancji.
Zbieg do innej gałęzi, dla Pumy mamy 8 rozwiązań; iteracyjny solver przyciąga się do tego, które jest najbliższe seedowi. Zmiana seeda może dać inną gałąź. To nie jest błąd, to cecha metody.

W panelu „Porównanie na żywo" niżej zobaczysz te zjawiska w praktyce: Transpose często stagnuje (potrzebuje tysięcy iteracji), Pseudoinwersja bywa niestabilna przy singularnościach, DLS jest niezawodny ale z residualnym błędem, Adaptive DLS łączy zalety obydwu.

Krok 1

Jakobian geometryczny, definicja

Niech $f: Q \to SE(3)$ będzie FK. Różniczka Frécheta $df_q: T_q Q \to T_{f(q)} SE(3) \cong \mathfrak{se}(3) = \mathbb{R}^6$ zapisana w bazie standardowej daje macierz 6×n zwaną jakobianem geometrycznym:

J(q) \;=\; \bigl[\,J_1(q)\;|\;J_2(q)\;|\;\cdots\;|\;J_n(q)\,\bigr] \in \mathbb{R}^{6 \times n}

Dla przegubu obrotowego i kolumna ma postać:

J_i(q) \;=\; \begin{bmatrix} \hat{z}_i \times (\mathbf{p}_{\text{ee}} - \mathbf{p}_i) \\ \hat{z}_i \end{bmatrix}

gdzie $\hat{z}_i$ jest jednostkowym wektorem osi obrotu przegubu i w ramce bazowej, a $\mathbf{p}_i$ , dowolnym punktem na tej osi (w implementacji: początek układu współrzędnych i-tej). Dla przegubu przesuwnego: $J_i = [\hat{z}_i;\; \mathbf{0}]$ .

Sens fizyczny: $J_i$ to wkład jednostkowej prędkości $\dot q_i$ do wektora prędkości przestrzennej efektora $\xi = [\mathbf{v};\, \boldsymbol{\omega}]^\top$ , a całościowo:

\xi = J(q)\,\dot q

Nieliniowy problem IK staje się lokalnie liniowy:

\mathbf{e}(q) \approx J(q)\,\Delta q \quad \Rightarrow \quad \Delta q = J^{\dagger}(q)\,\mathbf{e}(q)

gdzie $\mathbf{e}(q)$ to twist error:

\mathbf{e}(q) = \begin{bmatrix} \mathbf{p}^* - \mathbf{p}(q) \\ \log\!\bigl(R^*\,R(q)^\top\bigr) \end{bmatrix}

Część obrotowa to logarytm SO(3), wektor $\boldsymbol{\omega} = \theta\,\hat{k}$ reprezentujący obrót, który trzeba wykonać, by przejść z aktualnej orientacji do zadanej. Dla małych obrotów pokrywa się to z różnicą kątów Eulera, ale w ogólnym przypadku wymaga świadomej ekstrakcji osi i kąta z $R \in SO(3)$ .

Krok 2

Metoda I, Jacobian Transpose

Najprostsza iteracja: zamiast odwracać $J$ , użyj jego transpozycji jako przybliżenia pseudoinwersji (kierunek ten sam, skala nieodpowiednia):

\Delta q = \alpha\,J^{\top}\,\mathbf{e}

Metoda jest w istocie gradientem zstępowania na $\tfrac{1}{2}\|\mathbf{e}\|^2$ , pochodna względem $q$ to $-J^\top \mathbf{e}$ . Optymalny krok (wzdłuż Jᵀe minimalizujący błąd liniowy) znajduje się z:

\alpha^* = \frac{\langle \mathbf{e},\; J J^\top \mathbf{e}\rangle}{\|J J^\top \mathbf{e}\|^2}

Zalety: nie wymaga rozwiązywania układu liniowego (tylko macierz-wektor), jest odporny na singularności (Jᵀ nigdy nie "wybucha"). Wady: zbieżność liniowa, setki–tysiące iteracji dla średnich pozycji docelowych.

const JtE  = matvec(Jᵀ, e);
const JJtE = matvec(J, JtE);
const α    = (e·JJtE) / (JJtE·JJtE);
Δq = JtE.map(v => α * v);

Krok 3

Metoda II, Pseudoinwersja Moore–Penrose

Bezpośrednie odwrócenie liniowego modelu. Dla $n \geq 6$ (kwadratowego lub nadokreślonego) prawostronna inwersja minimalizująca $\|\Delta q\|$ :

J^{\dagger} = J^{\top}\,(J\,J^{\top})^{-1}, \qquad \Delta q = J^{\dagger}\,\mathbf{e}

Implementacyjnie: rozwiązujemy $J J^\top y = \mathbf{e}$ (układ 6×6), a potem $\Delta q = J^\top y$ .

Problem singularności: gdy $\det(J J^\top) \to 0$ (np. $q_5 \to 0$ dla nadgarstka sferycznego), $(J J^\top)^{-1}$ ma bardzo duże wartości własne. Krok $\Delta q$ staje się ogromny → linearyzacja jest nieważna → solver rozbiega się lub „skacze" przez singularność.

Dla 7-DOF i innych manipulatorów redundantnych ( $n > 6$ ) wariant right pseudoinverse pozostawia przestrzeń zerową jakobianu (ang. null-space) $\mathcal{N}(J)$ nietrywialną, czyli istnieją niezerowe zmiany kątów przegubów, które nie zmieniają pozy efektora. Można je wykorzystać do spełnienia dodatkowych ograniczeń (kolizje, limity przegubowe). Temat rozwiniemy w module 7.

Krok 4

Metoda III, Damped Least Squares (Levenberg–Marquardt)

Kompromis między pseudoinwersją (szybka, niestabilna) a transpozycją (powolna, stabilna): dodaj tłumienie $\lambda^2 I$ do macierzy, którą odwracasz:

\Delta q = J^{\top}\,(J J^\top + \lambda^2 I)^{-1}\,\mathbf{e}

Równoważnie $\Delta q$ minimalizuje funkcjonał:

\Delta q = \arg\min_{\Delta q}\;\|\mathbf{e} - J\,\Delta q\|^2 + \lambda^2\,\|\Delta q\|^2

To klasyczne tłumienie Tichonowa: $\lambda$ jest kosztem za każde jednostkowe przemieszczenie $\Delta q$ . Macierz $J J^\top + \lambda^2 I$ jest zawsze dodatnio określona (nawet przy pełnej singularności $J$ ), więc solver pozostaje stabilny. Kosztem jest błąd residualny $\sim \lambda$ , idealnie zerowa zbieżność wymaga $\lambda \to 0$ , co przywraca problemy pseudoinwersji.

Levenberg i Marquardt zaproponowali tę formę w kontekście nieliniowego najmniejszych kwadratów; dla IK jest to de facto standard przemysłowy (używany m.in. w ROS MoveIt jakoKDL Inverse Kinematics).

Krok 5

Metoda IV, Adaptive DLS (tłumienie zależne od residuum)

Słabość stałego $\lambda$ : za małe ⇒ problemy w singularności; za duże ⇒ wolna zbieżność daleko od celu. Praktyczna heurystyka (Levenberg-Marquardt-style):

\lambda_{\text{eff}}(\mathbf{e}) = \max\!\bigl(\lambda_0,\; c\,\|\mathbf{e}\|\bigr)

Daleko od celu ( $\|\mathbf{e}\|$ duże), $\lambda_{\text{eff}}$ duże, krok ostrożny. Blisko celu, $\lambda_{\text{eff}} \to \lambda_0$ , zbieżność tight. Wariant dodatkowy: kap wielkości kroku per-przegub (tu 0,3 rad), zapobiega „przeskokom" przy dużej linearyzacji.

Buss–Kim (2005) Selectively DLS: prawdziwy SDLS używa SVD $J = U\Sigma V^\top$ i tłumi każdy kierunek osobno zależnie od $\sigma_i$ . Dla celów dydaktycznych pokazujemy powyższy uproszczony wariant, który ma ten sam efekt ilościowy bez kosztu SVD.

Porównanie na żywo

Cztery solvery startują z tego samego seeda (konfiguracja głównego kontrolera) i zmierzają do tej samej pozy docelowej $T^*$ . Zobaczysz to, co odróżnia dobry solver od „papierowego": liczbę iteracji, czas i, krytyczne, stabilność przy trudnych celach (spróbuj pozy bliskiej wyciągnięcia ramienia lub wyrównania osi nadgarstka).

Konfiguracja przegubów

θ₁2.8°

θ₂-77.7°

θ₃6.8°

θ₄8.5°

θ₅-19.3°

θ₆172.0°

Poza efektora (T₀⁶)

Pozycja [m]

x = 0.5000

y = 0.1500

z = 0.3000

Orientacja RPY [°]

R = 0.00

P = 90.00

Y = 0.00

Poza docelowa T*

Pozycja [m]

xyz

Orientacja RPY [°]

RPY

Parametry porównania

Tolerancja pozycji [m]Tolerancja orientacji [rad]Tłumienie λ (DLS/SDLS)

metoda	iteracje	‖Δp‖ końcowe [m]	ΔR końcowe [rad]	czas [ms]	status

Trajektorie końcówki w trakcie iteracji

Każdy z czterech solverów startuje z tego samego seeda (aktualna konfiguracja głównego kontrolera) i zmierza do tej samej pozy docelowej (czerwona kropka). Pełna linia pokazuje ścieżkę TCP po kolejnych iteracjach, widać wprost, jak szybko solver dochodzi do celu i jaką drogą (prosta, kręta, oscylująca).

Syntetyczne porównanie

Aspekt	Transpose	Pinv	DLS	Adapt. DLS
Koszt iteracji	O(n²)	O(n³)	O(n³)	O(n³)
Liczba iteracji	~10³	~10	~10²	~10²
Singularności	odporny	rozbiega się	odporny (z błędem ~λ)	odporny + precyzyjny
Implementacja	trywialna	prosta	prosta	z heurystyką
W praktyce używany?	rzadko	tak, z zabezpieczeniami	tak, standard	tak, RMS, MoveIt

Co dalej

W module 4 sformułujemy IK jako problem optymalizacji z ograniczeniami (ograniczenia przegubowe, unikanie kolizji, multi-cel) i zastosujemy solvery globalne (Nelder–Mead, SQP, ewolucyjne). W module 7 wrócimy do tematu manipulacyjności i pokażemy, jak analiza SVD Jakobianu daje operatywną miarę odległości od singularności, i jak można ją włączyć jako dodatkowy cel optymalizacyjny w przestrzeni zerowej jakobianu.

Powiązania z dynamiką: Jakobian w tym module mapuje q̇ → ẋ (pierwsza pochodna). Druga pochodna i siły potrzebne do wytworzenia ruchu to temat modułu 9 (Newton-Euler): ten sam łańcuch propagacji od bazy do efektora, ale z prędkościami, przyspieszeniami i siłami w każdym ogniwie.