8.2 التغذية الراجعة للحالة (State Feedback)
اعتبر معادلة فضاء الحالة (state-space equation) أحادية الدخل أحادية الخرج (SISO) ذات البعد $ n $
حيث افترضنا $ d = 0 $ لتبسيط المناقشة. في التغذية الراجعة للحالة (state feedback)، يُعطى الدخل $ u $ بواسطة
كما هو موضح في الشكل 8.2. كل كسب تغذية راجعة (feedback gain) $ k_{i} $ ثابت حقيقي. يُسمى هذا تغذية راجعة سالبة للحالة ذات كسب ثابت (constant gain negative state feedback) أو ببساطة تغذية راجعة للحالة (state feedback). بإحلال (8.2) في (8.1) نحصل على
نظرية 8.1
الثنائي $ (\mathbf{A} - \mathbf{bk}, \mathbf{b}) $ ، لأي $ 1 \times n $ متجه ثابت حقيقي $ \mathbf{k} $ ، قابل للتحكم (controllable) إذا وفقط إذا كان $ (\mathbf{A}, \mathbf{b}) $ قابلا للتحكم (controllable).

برهان: نبرهن النظرية لـ $ n = 4 $ . عرّف

الشكل 8.2 تغذية راجعة للحالة (state feedback).
و
وهما مصفوفتا القابلية للتحكم (controllability matrices) لـ (8.1) و(8.3). ومن السهل التحقق من
لاحظ أن $ \mathbf{k} $ أبعاده $ 1 \times n $ وأن $ \mathbf{b} $ أبعاده $ n \times 1 $ . ومن ثم فإن $ \mathbf{kb} $ عدد قياسي (scalar)؛ وكذلك كل عنصر في المصفوفة اليمنى في (8.4). وبما أن المصفوفة اليمنى غير منفردة (nonsingular) لأي $ \mathbf{k} $ ، فإن رتبة (rank) $ \mathcal{C}_f $ تساوي رتبة $ \mathcal{C} $ . وبالتالي فإن (8.3) قابلة للتحكم إذا وفقط إذا كانت (8.1) قابلة للتحكم.
يمكن أيضا إثبات هذه النظرية مباشرة من تعريف قابلية التحكم (controllability). لتكن $ \mathbf{x}_0 $ و $ \mathbf{x}_1 $ حالتين (states) اعتباطيتين. إذا كانت (8.1) قابلة للتحكم، يوجد دخل $ u_1 $ ينقل $ \mathbf{x}_0 $ إلى $ \mathbf{x}_1 $ في زمن منتهٍ. الآن إذا اخترنا $ r_1 = u_1 + \mathbf{k}\mathbf{x} $ ، فإن الدخل $ r_1 $ لنظام التغذية الراجعة للحالة (state feedback system) سينقل $ \mathbf{x}_0 $ إلى $ \mathbf{x}_1 $ . وبالتالي نستنتج أنه إذا كانت (8.1) قابلة للتحكم، فـ(8.3) كذلك.
نرى من الشكل 8.2 أن الدخل $ r $ لا يتحكم مباشرة في الحالة (state) $ \mathbf{x} $ ؛ بل يولد $ u $ للتحكم في $ \mathbf{x} $ . لذلك إذا كان $ u $ لا يستطيع التحكم في $ \mathbf{x} $ ، فلن يستطيع $ r $ ذلك أيضا. وهذا يثبت النظرية مرة أخرى. Q.E.D.
على الرغم من أن خاصية قابلية التحكم (controllability property) ثابتة تحت أي تغذية راجعة للحالة (state feedback)، فإن خاصية قابلية الملاحظة (observability property) ليست كذلك. يوضح المثال التالي ذلك.
مثال 8.2.1 اعتبر معادلة فضاء الحالة (state-space equation)
يمكن بسهولة إظهار أن معادلة فضاء الحالة قابلة للتحكم (controllable) وقابلة للملاحظة (observable). الآن نقدم تغذية راجعة للحالة (state feedback)
تصبح معادلة تغذية راجعة للحالة (state feedback equation)
مصفوفة القابلية للتحكم (controllability matrix) هي
وهي غير منفردة (nonsingular). لذا فإن معادلة تغذية راجعة للحالة قابلة للتحكم. ومصفوفة القابلية للملاحظة (observability matrix) هي
وهي منفردة (singular). وبالتالي فإن معادلة تغذية راجعة للحالة غير قابلة للملاحظة (not observable). وسيُعطى سبب أن خاصية قابلية الملاحظة قد لا تُحفظ في تغذية راجعة للحالة لاحقا.
نستخدم مثالا لمناقشة ما يمكن تحقيقه بتغذية راجعة للحالة (state feedback).
مثال 8.2.2 اعتبر نباتا (plant) موصوفا بـ
لمصفوفة A كثير الحدود المميِّز (characteristic polynomial)
وبالتالي القيم الذاتية (eigenvalues) 4 و $ -2 $ . وهي غير مستقرة (unstable). لنقدم تغذية راجعة للحالة $ u = r - [k_1 k_2] \mathbf{x} $ . عندئذ توصف منظومة التغذية الراجعة للحالة بـ
لمصفوفة A الجديدة كثير الحدود المميِّز (characteristic polynomial)
من الواضح أن جذور $ \Delta_f(s) $ أو، على نحو مكافئ، القيم الذاتية (eigenvalues) لنظام التغذية الراجعة للحالة يمكن وضعها في أي مواضع باختيار $ k_{1} $ و $ k_{2} $ الملائمين. مثلا، إذا أُريد وضع القيمتين الذاتيتين عند $ -1 \pm j2 $ ، فإن كثير الحدود المميِّز المرغوب هو $ (s + 1 + j2)(s + 1 - j2) = s^2 + 2s + 5 $ . وبمساواة $ k_{1} - 2 = 2 $ و $ 3k_{2} - k_{1} - 8 = 5 $ نحصل على $ k_{1} = 4 $ و $ k_{2} = 17/3 $ . وبالتالي فإن كسب تغذية راجعة للحالة [4 17/3] سيُحرك القيم الذاتية من $ 4, -2 $ إلى $ -1 \pm j2 $ .
يبين هذا المثال أن تغذية راجعة للحالة يمكن استخدامها لوضع القيم الذاتية في أي مواضع مرغوبة. علاوة على ذلك، يمكن حساب كسب التغذية الراجعة بالتعويض المباشر. إلا أن هذا الأسلوب قد يصبح معقدا جدا لمعادلات فضاء الحالة ذات الأبعاد الثلاثة أو الأعلى. والأخطر من ذلك أن هذا الأسلوب لن يُظهر كيف يدخل شرط قابلية التحكم في التصميم. لذلك يلزم أسلوب أكثر منهجية. قبل المتابعة نحتاج إلى النظرية التالية. نعرض النظرية لـ $ n = 4 $ ؛ إلا أن النظرية صالحة لكل عدد صحيح موجب $ n $ .
نظرية 8.2
اعتبر معادلة فضاء الحالة في (8.1) مع $ n = 4 $ وكثير الحدود المميِّز (characteristic polynomial)
إذا كانت (8.1) قابلة للتحكم، فيمكن تحويلها بالتحويل $ \bar{\mathbf{x}} = \mathbf{P}\mathbf{x} $ مع
إلى الصيغة القابلة للتحكم (controllable form)
وعلاوة على ذلك، فإن دالة التحويل (transfer function) لـ(8.1) مع $ n = 4 $ تساوي

برهان: لتكن $ \mathcal{C} $ و $ \bar{\mathcal{C}} $ مصفوفتَي القابلية للتحكم (controllability matrices) لـ(8.1) و(8.7). في حالة SISO، كل من $ \mathcal{C} $ و $ \bar{\mathcal{C}} $ مربع. إذا كانت (8.1) قابلة للتحكم أو كانت $ \mathcal{C} $ غير منفردة، فـ $ \bar{\mathcal{C}} $ كذلك. وهما مرتبطتان بـ $ \bar{\mathcal{C}} = \mathbf{PC} $ (نظرية 6.2 ومعادلة (6.20)). ومن ثم لدينا
حُسبت مصفوفة القابلية للتحكم (controllability matrix) $ \mathcal{C} $ لـ(8.7) في (7.10). ويظهر أن معكوسها هو
يمكن التحقق من ذلك بضرب (8.9) في (7.10) للحصول على مصفوفة وحدة. لاحظ أن الحد الثابت $ \alpha_{4} $ في (8.5) لا يظهر في (8.9). بإحلال (8.9) في $ \mathbf{Q} = \mathcal{C}\bar{\mathcal{C}}^{-1} $ نحصل على (8.6). كما هو مبين في القسم 7.2، فإن معادلة فضاء الحالة في (8.7) هي تحقيق (realization) لـ(8.8). وبالتالي فإن دالة التحويل (transfer function) لـ(8.7) ومن ثم لـ(8.1) تساوي (8.8). وهذا يثبت النظرية. Q.E.D.
وبهذه النظرية، نحن مستعدون لمناقشة إسناد القيم الذاتية (eigenvalue assignment) بتغذية راجعة للحالة (state feedback).
نظرية 8.3
إذا كانت معادلة فضاء الحالة ذات البعد $ n $ في (8.1) قابلة للتحكم، فإن تغذية راجعة للحالة $ u(t) = r(t) - \mathbf{kx}(t) $ ، حيث $ \mathbf{k} $ متجه ثابت حقيقي أبعاده $ 1 \times n $ ، تجعل القيم الذاتية (eigenvalues) لـ $ \mathbf{A} - \mathbf{bk} $ قابلة للإسناد اعتباطيا، بشرط أن تُسنَد القيم الذاتية المترافقة عقديا في أزواج.

برهان: نبرهن مرة أخرى النظرية لـ $ n = 4 $ . إذا كانت (8.1) قابلة للتحكم، فيمكن تحويلها إلى الصيغة القابلة للتحكم (controllable form) في (8.7). لتكن $ \bar{\mathbf{A}} $ و $ \bar{\mathbf{b}} $ المصفوفتين في (8.7). عندئذ لدينا $ \bar{\mathbf{A}} = \mathbf{PAP}^{-1} $ و $ \bar{\mathbf{b}} = \mathbf{Pb} $ . وبإحلال $ \bar{\mathbf{x}} = \mathbf{Px} $ في تغذية راجعة للحالة نحصل على
حيث $ \bar{\mathbf{k}} := \mathbf{k}\mathbf{P}^{-1} $ . ولأن $ \bar{\mathbf{A}} - \bar{\mathbf{b}}\bar{\mathbf{k}} = \mathbf{P}(\mathbf{A} - \mathbf{b}\mathbf{k})\mathbf{P}^{-1} $ ، فإن $ \mathbf{A} - \mathbf{b}\mathbf{k} $ و $ \bar{\mathbf{A}} - \bar{\mathbf{b}}\bar{\mathbf{k}} $ لهما مجموعة القيم الذاتية (eigenvalues) نفسها. من أي مجموعة من القيم الذاتية المرغوبة يمكننا بسهولة تكوين
إذا اختيرت $ \bar{\mathbf{k}} $ على النحو
فإن معادلة تغذية راجعة للحالة تصبح
وبسبب الصيغة الرفيقة (companion form)، فإن كثير الحدود المميِّز (characteristic polynomial) لـ $ (\bar{\mathbf{A}} - \bar{\mathbf{b}} \bar{\mathbf{k}}) $ وبالتالي لـ $ (\mathbf{A} - \mathbf{b} \mathbf{k}) $ يساوي (8.10). إذن فإن معادلة تغذية راجعة للحالة لها مجموعة القيم الذاتية المرغوبة. ويمكن حساب كسب التغذية الراجعة $ \mathbf{k} $ من
مع $ \bar{\mathbf{k}} $ في (8.11)، و $ \bar{C}^{-1} $ في (8.9)، و $ \mathcal{C} = [\mathbf{b}\mathbf{Ab}\mathbf{A}^2\mathbf{b}\mathbf{A}^3\mathbf{b}] $ . Q.E.D.
نعطي اشتقاقا بديلا للصيغة في (8.11). نحسب
الذي يصبح، باستخدام (8.5) و(3.64)،
وبالتالي لدينا
ليكن $ z $ خرج كسب التغذية الراجعة المبين في الشكل 8.2 وليكن $ \bar{\mathbf{k}} = [k_{1} \bar{k}_{2} k_{3} \bar{k}_{4}] $ . وبما أن دالة التحويل (transfer function) من $ u $ إلى $ y $ في الشكل 8.2 تساوي
فإن دالة التحويل من $ u $ إلى $ z $ يجب أن تساوي
وبإحلال (8.15)، و(8.5)، و(8.10) في (8.14) نحصل على
وهذا يعطي (8.11).
دالة تحويل التغذية الراجعة (Feedback transfer function)
اعتبر نباتا (plant) موصوفا بـ $ (\mathbf{A},\mathbf{b},\mathbf{c}) $ . إذا كان $ (\mathbf{A},\mathbf{b}) $ قابلا للتحكم، فيمكن تحويل $ (\mathbf{A},\mathbf{b},\mathbf{c}) $ إلى الصيغة القابلة للتحكم (controllable form) في (8.7) ويمكن عندئذ قراءة دالة التحويل (transfer function) على أنها، لـ $ n = 4 $ ،
بعد تغذية راجعة للحالة، تصبح معادلة فضاء الحالة $ (\mathbf{A} - \mathbf{b}\mathbf{k},\mathbf{b},\mathbf{c}) $ وتظل في الصيغة القابلة للتحكم كما هو موضح في (8.12). وبالتالي فإن دالة تحويل التغذية الراجعة من $ r $ إلى $ y $ هي
نرى أن البسطين في (8.16) و(8.17) متماثلان. وبعبارة أخرى، فإن تغذية راجعة للحالة لا تؤثر في أصفار (zeros) دالة تحويل النبات. وهذه في الواقع خاصية عامة للتغذية الراجعة (feedback): تستطيع التغذية الراجعة إزاحة أقطاب (poles) النبات لكنها لا تؤثر في الأصفار. ويمكن استخدام ذلك لشرح لماذا قد تغيّر تغذية راجعة للحالة خاصية قابلية الملاحظة (observability property) لمعادلة الحالة. إذا أُزيح قطب واحد أو أكثر ليتطابق مع أصفار $ \hat{g}(s) $ ، فإن البسط والمقام في $ \hat{g}_f(s) $ في (8.17) لن يكونا متباينين أوليا (coprime). وبالتالي فإن معادلة فضاء الحالة في (8.12) وبصورة مكافئة، $ (\mathbf{A} - \mathbf{bk}, \mathbf{c}) $ ، غير قابلة للملاحظة (not observable) (نظرية 7.1).
مثال 8.2.3 اعتبر الرقّاص المقلوب (inverted pendulum) الذي دُرس في مثال 6.2.2. معادلة فضاء الحالة له، كما استُنتجت في (6.11)، هي
إنه قابل للتحكم؛ وبالتالي يمكن إسناد قيمه الذاتية اعتباطيا. ولأن مصفوفة A مثلثية كتلية (block triangular)، يمكن الحصول على كثير الحدود المميِّز (characteristic polynomial) بالفحص كما يلي
أولا نحسب $ \mathbf{P} $ التي ستحول (8.18) إلى الصيغة المعيارية القابلة للتحكم (controllable canonical form). باستخدام (8.6)، لدينا
ومعكوسها هو
لتكن القيم الذاتية المرغوبة $ -1.5 \pm 0.5j $ و $ -1 \pm j $ . عندئذ لدينا
وبالتالي، باستخدام (8.11)،
و
سيحوّل كسب تغذية راجعة للحالة هذا القيم الذاتية للنبات من $ \{0, 0, \pm j\sqrt{5}\} $ إلى $ \{-1.5 \pm 0.5j, -1 \pm j\} $ .
تقوم دالة MATLAB المسماة place بحساب مكاسب تغذية راجعة للحالة (state feedback gains) لوضع القيم الذاتية (eigenvalue placement) أو إسنادها (assignment). في المثال نكتب
مما يعطي $ [-1.6667 - 3.6667 - 8.5833 - 4.3333] $ . وهذا هو الكسب في (8.19).
قد يتساءل المرء في هذه المرحلة كيف يختار مجموعة القيم الذاتية المرغوبة. يعتمد ذلك على معايير الأداء (performance criteria)، مثل زمن النهوض (rise time)، وزمن الاستقرار (settling time)، والتجاوز (overshoot)، و

الشكل 8.3 موضع القيم الذاتية المرغوبة (desired eigenvalue location).

وغيرها المستخدمة في التصميم. ولأن استجابة النظام تعتمد ليس فقط على الأقطاب (poles) بل أيضا على الأصفار (zeros)، فإن أصفار النبات ستؤثر أيضا في الاختيار. بالإضافة إلى ذلك، ستتشبع معظم الأنظمة الفيزيائية أو تحترق إذا كانت سعة إشارة التشغيل كبيرة جدا. وهذا سيؤثر مرة أخرى في اختيار الأقطاب المرغوبة. كدليل إرشادي، يمكن وضع جميع القيم الذاتية داخل المنطقة المشار إليها بـ $ C $ في الشكل 8.3(a). ويحد المنطقة من اليمين خط رأسي. وكلما زادت مسافة الخط الرأسي عن المحور التخيلي، كانت الاستجابة أسرع. كما تُحد المنطقة بخطين مستقيمين منطلقين من الأصل بزاوية $ \theta $ . وكلما كبرت الزاوية، زاد التجاوز. انظر المرجع 7. إذا وضعنا جميع القيم الذاتية في نقطة واحدة أو جمعناها في منطقة صغيرة جدا، فعادة تكون الاستجابة بطيئة وتكون إشارة التشغيل كبيرة. لذلك من الأفضل توزيع جميع القيم الذاتية بالتساوي حول دائرة نصف قطرها $ r $ داخل القطاع كما هو موضح. كلما كبر نصف القطر كانت الاستجابة أسرع؛ إلا أن إشارة التشغيل ستكون أيضا أكبر. علاوة على ذلك، سيكون عرض النطاق (bandwidth) لنظام التغذية الراجعة أكبر وسيكون النظام الناتج أكثر تأثرا بالضوضاء (noise). لذلك قد يتطلب الاختيار النهائي مفاضلات بين متطلبات متعارضة عديدة. إحدى الطرق للمضي قدما هي المحاكاة الحاسوبية. وطريقة أخرى هي إيجاد كسب تغذية راجعة للحالة $ k $ لتقليل مؤشر الأداء التربيعي (quadratic performance index)
انظر المرجع 1. غير أن اختيار $ \mathbf{Q} $ و $ \mathbf{R} $ يتطلب المحاولة والخطأ. وخلاصة القول إن كيفية اختيار مجموعة من القيم الذاتية المرغوبة ليست مسألة بسيطة.
نذكر أن النظريات 8.1 حتى 8.3 - في الواقع، جميع النظريات التي ستُقدَّم لاحقا في هذا الفصل - تنطبق على حالة الزمن المتقطع (discrete-time case) دون أي تعديل. والفرق الوحيد هو أن المنطقة في الشكل 8.3(a) يجب أن تُستبدل بتلك في الشكل 8.3(b) التي تُستحصل بالتحويل $ z = e^{s} $ .