3.6 دوال مصفوفة مربعة (Functions of a Square Matrix)
يدرس هذا القسم دوال (functions) مصفوفة مربعة (square matrix). نستخدم صيغة Jordan (Jordan form) على نطاق واسع لأن كثيرًا من خصائص الدوال يمكن تقريبًا تصورها بدلالة صيغة Jordan. ندرس أولًا متعددات الحدود (polynomials) ثم الدوال العامة (general functions) لمصفوفة مربعة.
متعددات الحدود لمصفوفة مربعة (Polynomials of a square matrix)
لتكن $ \mathbf{A} $ مصفوفة مربعة. إذا كان $ k $ عددًا صحيحًا موجبًا، فإننا نعرّف
و $ \mathbf{A}^0 = \mathbf{I} $ . لتكن $ f(\lambda) $ كثيرة حدود (polynomial) مثل $ f(\lambda) = \lambda^3 + 2\lambda^2 - 6 $ أو $ (\lambda + 2)(4\lambda - 3) $ . عندئذ يُعرّف $ f(\mathbf{A}) $ كما يلي
إذا كانت $ \mathbf{A} $ كتلية قطرية (block diagonal) مثل
حيث إن $ \mathbf{A}_1 $ و $ \mathbf{A}_2 $ مصفوفتان مربعتان بأي رتبة، فمن السهل التحقق من أن
اعتبر تحويل التشابه (similarity transformation) $ \hat{\mathbf{A}} = \mathbf{Q}^{-1}\mathbf{A}\mathbf{Q} $ أو $ \mathbf{A} = \mathbf{Q}\hat{\mathbf{A}}\mathbf{Q}^{-1} $ . وبما أن
فإننا نحصل على
متعدد الحدود أحادي (monic polynomial) هو متعدد حدود (polynomial) معاملُه الرائد (leading coefficient) يساوي 1. يُعرَّف متعدد الحدود الأدنى (minimal polynomial) للمصفوفة $ \mathbf{A} $ بأنه كثير الحدود الأحادي $ \psi(\lambda) $ ذو أقل درجة بحيث $ \psi(\mathbf{A}) = \mathbf{0} $ . لاحظ أن $ \mathbf{0} $ هي مصفوفة صفرية (zero matrix) من الرتبة نفسها مثل $ \mathbf{A} $ . نتيجة مباشرة من (3.42) هي أن $ f(\mathbf{A}) = \mathbf{0} $ إذا وفقط إذا كان $ f(\hat{\mathbf{A}}) = \mathbf{0} $ . لذا فإن $ \mathbf{A} $ و $ \hat{\mathbf{A}} $ أو، بصورة أعم، جميع المصفوفات المتشابهة (similarity matrices) لها متعدد الحدود الأدنى نفسه. إن حساب متعدد الحدود الأدنى مباشرة من $ \mathbf{A} $ ليس بسيطًا (انظر المسألة 3.30)؛ ومع ذلك، إذا كان تمثيل Jordanform (Jordan form) لـ $ \mathbf{A} $ متاحًا، فإن متعدد الحدود الأدنى يمكن قراءته بالملاحظة.
لتكن $ \lambda_{i} $ قيمة ذاتية (eigenvalue) للمصفوفة $ \mathbf{A} $ بتعددية $ n_i $ . أي إن كثير الحدود المميِّز (characteristic polynomial) للمصفوفة $ \mathbf{A} $ هو
افترض أن صيغة Jordan (Jordan form) للمصفوفة $ \mathbf{A} $ معروفة. لكل قيمة ذاتية، قد توجد كتلة Jordan واحدة أو أكثر. يُعرَّف مؤشر (index) $ \lambda_{i} $ ، ويرمز له بـ $ \bar{n}_i $ ، بأنه أكبر رتبة (order) لجميع كتل Jordan المرتبطة بـ $ \lambda_{i} $ . ومن الواضح أن $ \bar{n}_i \leq n_i $ . على سبيل المثال، تعدديات $ \lambda_1 $ في جميع المصفوفات الخمس في (3.39) هي 4؛ ومؤشراتها هي على الترتيب 4 و3 و2 و2 و1. تعدديات ومؤشرات $ \lambda_2 $ في جميع المصفوفات الخمس في (3.39) كلها 1. باستخدام مؤشرات جميع القيم الذاتية، يمكن التعبير عن متعدد الحدود الأدنى كما يلي
وبدرجة $ \bar{n} = \sum \bar{n}_i \leq \sum n_i = n = $ بُعد $ \mathbf{A} $ . على سبيل المثال، متعددات الحدود الأدنى للمصفوفات الخمس في (3.39) هي
أما كثيرات الحدود المميِّزة لها كلها فتساوي
نرى أن متعدد الحدود الأدنى هو عامل (factor) من كثير الحدود المميِّز، وأن درجته أقل من أو تساوي درجة كثير الحدود المميِّز. ومن الواضح أنه إذا كانت جميع القيم الذاتية لـ $ \mathbf{A} $ متميزة، فإن متعدد الحدود الأدنى يساوي كثير الحدود المميِّز.
باستخدام خاصية انعدام القوى (nilpotent) في (3.40)، يمكننا إظهار أن
وأن لا يوجد كثير حدود ذي درجة أقل يحقق الشرط. وبالتالي فإن $ \psi(\lambda) $ كما عُرّف هو متعدد الحدود الأدنى.
نظرية 3.4 (مبرهنة Cayley-Hamilton (Cayley-Hamilton theorem))
لتكن
هي كثيرة الحدود المميِّزة للمصفوفة $ \mathbf{A} $ . عندئذ
بعبارة أخرى، تحقق المصفوفة كثير الحدود المميِّز الخاص بها. وبما أن $ n_i \geq \bar{n}_i $ ، فإن كثير الحدود المميِّز يحتوي على متعدد الحدود الأدنى كعامل أو $ \Delta(\lambda) = \psi(\lambda) h(\lambda) $ لكثير حدود ما $ h(\lambda) $ . وبما أن $ \psi(\mathbf{A}) = \mathbf{0} $ ، نحصل على $ \Delta(\mathbf{A}) = \psi(\mathbf{A}) h(\mathbf{A}) = \mathbf{0} \cdot h(\mathbf{A}) = \mathbf{0} $ . وهذا يثبت النظرية. تفيد مبرهنة Cayley-Hamilton (Cayley-Hamilton theorem) بأن $ \mathbf{A}^n $ يمكن كتابتها كتركيبة خطية (linear combination) من $ \{\mathbf{I}, \mathbf{A}, \dots, \mathbf{A}^{n-1}\} $ . ضرب (3.43) في $ \mathbf{A} $ يعطي
وهذا يعني أن $ \mathbf{A}^{n + 1} $ يمكن كتابتها كتركيبة خطية من $ \{\mathbf{A},\mathbf{A}^2,\dots ,\mathbf{A}^n\} $ ، والتي يمكن بدورها كتابتها كتركيبة خطية من $ \{\mathbf{I},\mathbf{A},\ldots ,\mathbf{A}^{n - 1}\} $ . وبالاستمرار، نستنتج أنه لأي كثير حدود $ f(\lambda) $ ، مهما كانت درجته كبيرة، فإن $ f(\mathbf{A}) $ يمكن دائمًا التعبير عنه على الصورة
لبعض $ \beta_{i} $ . وبعبارة أخرى، كل كثير حدود لمصفوفة $ n \times n $ هي $ \mathbf{A} $ يمكن التعبير عنه كتركيبة خطية من $ \{\mathbf{I}, \mathbf{A}, \dots, \mathbf{A}^{n-1}\} $ . إذا كان متعدد الحدود الأدنى للمصفوفة $ \mathbf{A} $ بدرجة $ \bar{n} $ متاحًا، فإن كل كثير حدود لـ $ \mathbf{A} $ يمكن التعبير عنه كتركيبة خطية من $ \{\mathbf{I}, \mathbf{A}, \dots, \mathbf{A}^{\bar{n}-1}\} $ . هذه نتيجة أفضل. ومع ذلك، لأن $ \bar{n} $ قد لا يكون متاحًا، سنناقش فيما يلي فقط (3.44) مع فهم أن كل المناقشات تنطبق على $ \bar{n} $ .
إحدى طرق حساب (3.44) هي استخدام القسمة المطولة (long division) للتعبير عن $ f(\lambda) $ كما يلي
حيث إن $ q(\lambda) $ هو خارج القسمة و $ h(\lambda) $ هو الباقي بدرجة أقل من $ n $ . عندئذ نحصل على
القسمة المطولة ليست مريحة إذا كانت درجة $ f(\lambda) $ أكبر بكثير من درجة $ \Delta(\lambda) $ . في هذه الحالة، يمكننا حل $ h(\lambda) $ مباشرة من (3.45). لنأخذ
حيث إن $ n $ المجهولات $ \beta_{i} $ مطلوب حلها. إذا كانت جميع القيم الذاتية $ n $ للمصفوفة $ \mathbf{A} $ متميزة، فيمكن حل هذه $ \beta_{i} $ من المعادلات $ n $ التالية
لـ $ i = 1, 2, \ldots, n $ . إذا كانت $ \mathbf{A} $ لها قيم ذاتية مكررة، فيجب اشتقاق (3.45) للحصول على معادلات إضافية. يُذكر ذلك في نظرية.
نظرية 3.5
لتكن $ f(\lambda) $ ومصفوفة $ n \times n $ هي $ \mathbf{A} $ لها كثير الحدود المميِّز
حيث إن $ n = \sum_{i=1}^{m} n_i $ . عرّف
وهي كثيرة حدود بدرجة $ n - 1 $ وبـ $ n $ معاملات مجهولة. تُحل هذه المجهولات $ n $ من مجموعة المعادلات $ n $ التالية:
حيث
و $ h^{(l)}(\lambda_i) $ تُعرَّف بصورة مماثلة. عندئذ
ويُقال إن $ h(\lambda) $ يساوي $ f(\lambda) $ على طيف (spectrum) $ \mathbf{A} $ .
مثال 3.6.1 احسب $ \mathbf{A}^{100} $ حيث
وبعبارة أخرى، إذا كانت $ f(\lambda) = \lambda^{100} $ ، فاحسب $ f(\mathbf{A}) $ . كثير الحدود المميِّز لـ $ \mathbf{A} $ هو $ \Delta(\lambda) = \lambda^2 + 2\lambda + 1 = (\lambda + 1)^2 $ . لتكن $ h(\lambda) = \beta_0 + \beta_1\lambda $ . على طيف $ \mathbf{A} $ ، لدينا
وهكذا نحصل على $ \beta_{1} = -100, \beta_{0} = 1 + \beta_{1} = -99, h(\lambda) = -99 - 100\lambda $ ، و
من الواضح أن $ \mathbf{A}^{100} $ يمكن أيضًا الحصول عليها بضرب A مئة مرة. لكن من الأبسط استخدام نظرية 3.5.
دوال مصفوفة مربعة (Functions of a square matrix)
لتكن $ f(\lambda) $ أي دالة (function)، ليست بالضرورة كثيرة حدود. إحدى طرق تعريف $ f(\mathbf{A}) $ هي استخدام نظرية 3.5. لتكن $ h(\lambda) $ كثيرة حدود من الدرجة $ n - 1 $ ، حيث $ n $ هو رتبة $ \mathbf{A} $ .
نحل معاملات $ h(\lambda) $ بمساواة $ f(\lambda) = h(\lambda) $ على طيف $ \mathbf{A} $ . عندئذ تُعرَّف $ f(\mathbf{A}) $ بأنها $ h(\mathbf{A}) $ .
مثال 3.6.2 لتكن
احسب $ e^{\mathbf{A}_1 t} $ . أو، بصورة مكافئة، إذا كانت $ f(\lambda) = e^{\lambda t} $ ، فما هو $ f(\mathbf{A}_1) $ ؟
كثير الحدود المميِّز لـ $ \mathbf{A}_1 $ هو $ (\lambda - 1)^2 (\lambda - 2) $ . لتكن $ h(\lambda) = \beta_0 + \beta_1\lambda + \beta_2\lambda^2 $ . عندئذ
لاحظ أن الاشتقاق في المعادلة الثانية بالنسبة إلى $ \lambda $ ، وليس $ t $ . بحل هذه المعادلات نحصل على $ \beta_0 = -2te^t + e^{2t} $ ، $ \beta_1 = 3te^t + 2e^t - 2e^{2t} $ و $ \beta_2 = e^{2t} - e^t - te^t $ . وبالتالي نحصل على
مثال 3.6.3 لتكن
احسب $ e^{\mathbf{A}_2t} $ . كثير الحدود المميِّز لـ $ \mathbf{A}_2 $ هو $ (\lambda - 1)^2 (\lambda - 2) $ ، وهو نفسه لـ $ \mathbf{A}_1 $ . ومن ثم لدينا نفس $ h(\lambda) $ كما في مثال 3.6.2. بالتالي نحصل على
مثال 3.6.4 اعتبر كتلة Jordan من الرتبة 4:
كثير حدودها المميِّز هو $ (\lambda - \lambda_1)^4 $ . رغم أننا يمكن أن نختار $ h(\lambda) $ على صورة $ \beta_0 + \beta_1\lambda + \beta_2\lambda + \beta_3\lambda^3 $ ، إلا أن الاختيار الأبسط حسابيًا هو
وهذا الاختيار مسموح لأن $ h(\lambda) $ درجته $ (n - 1) = 3 $ و $ n = 4 $ معاملات مستقلة مجهولة. شرط $ f(\lambda) = h(\lambda) $ على طيف $ \hat{\mathbf{A}} $ يعطي مباشرة
ومن ثم نحصل على
باستخدام الأشكال الخاصة لـ $ (\hat{\mathbf{A}} - \lambda_1 \mathbf{I})^k $ كما نوقش في (3.40)، نحصل بسهولة على
إذا كانت $ f(\lambda) = e^{\lambda t} $ ، فإن
لأن دوال $ \mathbf{A} $ تُعرَّف عبر كثيرات حدود $ \mathbf{A} $ ، فإن المعادلتين (3.41) و(3.42) تنطبقان على الدوال.
مثال 3.6.5 اعتبر
هي كتلية قطرية وتحتوي على كتلتين من Jordan. إذا كانت $ f(\lambda) = e^{\lambda t} $ ، فإن (3.41) و(3.48) تعطيان
إذا كانت $ f(\lambda) = (s - \lambda)^{-1} $ ، فإن (3.41) و(3.47) تعطيان
استخدام متسلسلات القوى (Using power series)
تم تعريف دالة $ \mathbf{A} $ باستخدام كثير حدود بدرجة منتهية. نعرض الآن تعريفًا بديلًا باستخدام متسلسلة قوى (power series) لا نهائية. افترض أن $ f(\lambda) $ يمكن التعبير عنها بمتسلسلة القوى
بنصف قطر تقارب (radius of convergence) $ \rho $ . إذا كانت قيم جميع القيم الذاتية لـ $ \mathbf{A} $ ذات مطلق أقل من $ \rho $ ، فيمكن تعريف $ f(\mathbf{A}) $ على أنها
بدلًا من إثبات تكافؤ هذا التعريف والتعريف المعتمد على نظرية 3.5، نستخدم (3.50) لاشتقاق (3.47).
مثال 3.6.6 اعتبر مصفوفة صيغة Jordan $ \hat{\mathbf{A}} $ في (3.46). لتكن $ f(\lambda) $ دالة موسعة في متسلسلة Taylor على الصورة
حيث إن $ \lambda_{1} $ هي القيمة الذاتية لـ $ \hat{\mathbf{A}} $ . عندئذ نحصل على
وبما أن $ (\hat{\mathbf{A}} - \lambda_1 \mathbf{I})^k = \mathbf{0} $ لكل $ k \geq n = 4 $ كما نوقش في (3.40)، فإن المتسلسلة اللانهائية تختزل مباشرة إلى (3.47). وبذلك تؤدي التعريفات إلى الدالة نفسها للمصفوفة.
أهم دالة لـ $ \mathbf{A} $ هي الدالة الأسية (exponential function) $ e^{\mathbf{A}t} $ . للدالة $ e^{\lambda t} $ متسلسلة Taylor التالية بالنسبة إلى $ \lambda_1 = 0 $ ، والتي تُسمّى غالبًا متسلسلة Maclaurin (Maclaurin series)،
تتقارب المتسلسلة لكل $ \lambda $ و $ t $ منتهيين. وبالتالي نحصل على
تتضمن هذه المتسلسلة الضرب والجمع فقط، وقد تتقارب بسرعة؛ لذلك فهي مناسبة للحساب بالحاسوب. نورد فيما يلي البرنامج في MATLAB الذي يحسب (3.51) لـ $ t = 1 $ :
Function E=expmdemo2(A)
E=zeros(size(A));
F=eye(size(A));
k=1;
while norm(E+F-E,1)>0
E=E+F;
F=A*F/k;
k=k+1;
end
في البرنامج، تشير $ \mathbf{E} $ إلى المجموع الجزئي و $ \mathbf{F} $ هو الحد التالي الذي سيُضاف إلى $ \mathbf{E} $ . السطر الأول يعرّف الدالة. السطران التاليان يهيئان $ \mathbf{E} $ و $ \mathbf{F} $ . لتكن $ c_k $ هي الحد $ k $ من (3.51) مع $ t = 1 $ . عندئذ لدينا $ c_{k+1} = (\mathbf{A} / k)c_k $ لـ $ k = 1, 2, \ldots $ . وبالتالي لدينا $ \mathbf{F} = \mathbf{A}^* \mathbf{F} / k $ . يتوقف الحساب إذا كانت معيار 1 (1-norm) لـ $ \mathbf{E} + \mathbf{F} - \mathbf{E} $ ، ويرمز له بـ norm $ (\mathbf{E} + \mathbf{F} - \mathbf{E}, 1) $ ، يُقرَّب إلى 0 في الحواسيب. وبما أن الخوارزمية تقارن $ \mathbf{F} $ و $ \mathbf{E} $ ، وليس $ \mathbf{F} $ و 0، فإنها تستخدم norm $ (\mathbf{E} + \mathbf{F} - \mathbf{E}, 1) $ بدلًا من norm $ (\mathbf{F}, 1) $ . لاحظ أن norm(a,1) هي معيار 1 الذي نوقش في القسم 3.2 للمتجهات وسيُناقش في القسم 3.11 للمصفوفات. نرى أن المتسلسلة يمكن بالفعل برمجتها بسهولة. لتحسين النتيجة المحسوبة، يمكن استخدام تقنيات التحجيم والتربيع (scaling and squaring). في MATLAB، تستخدم الدالة expmdemo2 المعادلة (3.51). أما الدالة expm or expmdemo1 فتستخدم تقريب Pad‚ (Pad‚ approximation). وهي تعطي نتائج مماثلة لـ expmdemo2 لكنها تتطلب نحو نصف زمن الحوسبة. لذلك تُفضَّل expm على expmdemo2. الدالة expmdemo3 تستخدم صيغة Jordan، لكنها ستعطي حلاً غير صحيح إذا كانت المصفوفة غير قابلة للقطرنة (diagonalizable). إذا احتجنا إلى حل بصيغة مغلقة (closed-form) لـ $ e^{\mathbf{A}t} $ ، فيجب استخدام نظرية 3.5 أو صيغة Jordan لحساب $ e^{\mathbf{A}t} $ .
نشتق بعض الخصائص المهمة لـ $ e^{\mathbf{A}t} $ لنختتم هذا القسم. باستخدام (3.51)، يمكننا بسهولة التحقق من المعادلات التالية
لإظهار (3.54)، نضع $ t_2 = -t_1 $ . عندئذ تؤدي (3.53) و(3.52) إلى
مما يستلزم (3.54). وبالتالي يمكن الحصول على معكوس $ e^{\mathbf{A}t} $ ببساطة بتغيير إشارة $ t $ . اشتقاق (3.51) حدًا حدًا يعطي
وبالتالي نحصل على
وهذه معادلة مهمة. نذكر أن
لا تتحقق المساواة إلا إذا كانت $ \mathbf{A} $ و $ \mathbf{B} $ تتبادلان (commute) أو $ \mathbf{AB} = \mathbf{BA} $ . ويمكن التحقق من ذلك بالتعويض المباشر في (3.51).
يُعرَّف تحويل لابلاس (Laplace transform) لدالة $ f(t) $ كما يلي
يمكن إظهار أن
أخذ تحويل لابلاس لـ(3.51) يعطي
وبما أن المتسلسلة اللانهائية
تتقارب عندما $ |s^{-1}\lambda | < 1 $ ، نحصل على
و
على الرغم من أن هذا الاشتقاق يتطلب أن يكون $ s $ كبيرًا بما يكفي بحيث تكون مقادير جميع القيم الذاتية لـ $ s^{-1}\mathbf{A} $ أقل من 1، فإن المعادلة (3.58) صحيحة فعليًا لكل $ s $ باستثناء القيم الذاتية لـ $ \mathbf{A} $ . ويمكن أيضًا إثبات (3.58) من (3.55). وبما أن $ \mathcal{L}[df(t) / dt] = s\mathcal{L}[f(t)] - f(0) $ ، فإن تطبيق تحويل لابلاس على (3.55) يعطي
أو
مما يستلزم (3.58).