
A new coding tutorial demonstrates how to build a complete markerless 3D human kinematics pipeline using Pose2Sim, RTMPose, and OpenSim entirely within Google Colab. The guide walks through calibration, pose estimation, triangulation, and inverse kinematics, making research-grade biomechanical analysis accessible to anyone with a browser.
أثار دليل برمجي نُشر حديثًا إعجابًا واسعًا في أوساط علم الميكانيكا الحيوية ورؤية الحاسوب، إذ يُظهر كيف يُمكن لأي شخص يملك حسابًا على جوجل إنشاء مسار كامل لتحليل الحركة البشرية ثلاثية الأبعاد دون استخدام علامات، وذلك بالكامل داخل متصفح الإنترنت. يعتمد هذا الدليل على برامج Pose2Sim و RTMPose و OpenSim التي تعمل على منصة جوجل كولاب ، مما يُغني عن الحاجة إلى مختبرات التقاط الحركة المكلفة التي تعتمد على العلامات، ويجعل تحليل الميكانيكا الحيوية عالي الجودة متاحًا للطلاب والأطباء والمطورين المستقلين على حد سواء.
يرشد هذا الدليل المستخدمين خلال جميع مراحل سير عمل Pose2Sim، بدءًا من إعداد البيئة الأولية وصولًا إلى إنشاء منحنيات زوايا المفاصل النهائية. ولأن Colab يعمل في بيئة بدون شاشة أو واجهة مستخدم رسومية، فإنه يتطلب خطوات تهيئة خاصة في البداية، وهي تفصيلة غالبًا ما يتم إغفالها وتُسبب ارتباكًا للمستخدمين الجدد. بمجرد أن يصبح وقت التشغيل جاهزًا، تتكشف عملية المعالجة بتسلسل منطقي.
في كل مرحلة، يشجع البرنامج التعليمي المستخدمين على فحص المخرجات الوسيطة - تصور المسارات، والتحقق من أخطاء إعادة الإسقاط، ورسم زوايا المفاصل - بحيث تكون مساهمة كل مكون في النتيجة النهائية واضحة.
لا تزال تقنية التقاط الحركة البصرية التقليدية (مثل Vicon أو OptiTrack) المعيار الذهبي في العديد من المختبرات البحثية، إلا أنها تنطوي على عوائق كبيرة. إذ تُكلّف هذه الأنظمة عشرات الآلاف من الدولارات، وتتطلب وضع علامات عاكسة بدقة على الجسم، فضلاً عن ضرورة توفير بيئات مختبرية مضبوطة. وفي تحليل المشية السريري، أو التدريب الرياضي الميداني، أو الدراسات السكانية واسعة النطاق، غالباً ما تُشكّل هذه القيود عائقاً كبيراً.
تُغيّر الأساليب غير المعتمدة على العلامات المعادلة تمامًا. إذ تحلّ أجهزة الهواتف الذكية متعددة الكاميرات أو كاميرات الحركة منخفضة التكلفة محلّ مصفوفات الأشعة تحت الحمراء، ويحلّ التعلّم العميق محلّ العلامات اللاصقة. وقد تقلّصت فجوة الدقة بين الطرق المعتمدة على العلامات والطرق غير المعتمدة عليها بشكل كبير في السنوات الأخيرة، حيث أظهرت الدراسات المُحكّمة أن متوسط أخطاء زاوية المفصل أقل من خمس درجات للعديد من الحركات، وهو ما يقع ضمن الحدود ذات الدلالة السريرية.
إذا كنت جديدًا في كيفية استخدام التعلم العميق لتقدير وضعية الجسم البشري، فإن نظرتنا العامة على OSGym: إطار عمل البنية التحتية لنظام التشغيل لوكلاء استخدام الكمبيوتر توفر معلومات أساسية مفيدة.
تم تطوير Pose2Sim من قبل باحثين بقيادة ديفيد باجنون في جامعة ليون، وهي حزمة برمجية مفتوحة المصدر مكتوبة بلغة بايثون، تعمل على سد الفجوة بين مكتبات تقدير الوضعيات ثنائية الأبعاد وبرامج محاكاة الجهاز العضلي الهيكلي. تتولى هذه الحزمة العمليات المعقدة التي كانت تتطلب سابقًا برامج نصية مخصصة أو أدوات احتكارية، مثل المعايرة والتثليث والتصفية وإضافة العلامات.
RTMPose هو برنامج لتقدير وضعية الجسم في الوقت الفعلي وبدقة عالية من OpenMMLab، يحقق توازناً مثالياً بين السرعة والدقة. بفضل بنيته الخفيفة، يُعدّ مناسباً بشكل خاص لبيئات التشغيل المدعومة بوحدات معالجة الرسومات (GPU) في Colab، حيث يمتلك المستخدمون عادةً بطاقة T4 أو A100 واحدة لجلسات محدودة.
يُعدّ برنامج OpenSim، الذي طُوّر في الأصل في مختبر الميكانيكا الحيوية العصبية العضلية بجامعة ستانفورد، المنصة مفتوحة المصدر الرائدة في مجال نمذجة ومحاكاة الجهاز العضلي الهيكلي. يقوم محلل الحركة العكسية الخاص به بأخذ مواقع العلامات ثلاثية الأبعاد ومطابقتها مع نموذج هيكلي مُصغّر، ليُخرج زوايا المفاصل التي تصف كيفية تحرك كل جزء من أجزاء الجسم في الفضاء.
إنّ دمج هذه العملية بأكملها في دفتر ملاحظات Colab واحد يزيل آخر عقبة رئيسية أمام اعتمادها: إدارة البيئة المحلية. قد يستغرق تثبيت Pose2Sim، وتوابع RTMPose، وروابط بايثون الخاصة بـ OpenSim على جهاز شخصي ساعاتٍ طويلة، نظرًا لتضارب إصدارات المكتبات وخصائص النظام الأساسي.
مع Colab، تُكتب جميع التبعيات في دفتر الملاحظات نفسه. يبدأ الباحث في نيروبي وطالب البكالوريوس في ساو باولو من نفس الصفحة الفارغة تمامًا. وتصبح إمكانية إعادة الإنتاج -وهي المشكلة الدائمة في البحث الحاسوبي- أمرًا في غاية السهولة.
للمزيد حول كيفية إعادة تشكيل دفاتر الملاحظات السحابية لسير عمل أبحاث الذكاء الاصطناعي، اطلع على مقالنا حول دليل تنفيذ ModelScope: البحث والضبط الدقيق والتصدير .
يتماشى التوجه نحو علم الحركة بدون علامات مع اتجاهات أوسع نطاقًا في أدوات الذكاء الاصطناعي المتاحة للجميع. تقدم شركات مثل Theia Markerless وKinatrax حلولًا تجارية بدون علامات لفرق رياضية محترفة، لكن البدائل مفتوحة المصدر تكتسب زخمًا سريعًا. يوفر دمج Pose2Sim وOpenSim لأي باحث مسارًا مجانيًا وجاهزًا للنشر.
أشار خبراء الميكانيكا الحيوية إلى أن التحدي المتبقي يكمن في التحقق من صحة النتائج على نطاق واسع. فبينما تُعدّ المقارنات التي تُجرى في مختبر واحد مع بيانات العلامات المرجعية المعيارية الذهبية مُشجّعة، إلا أن المجتمع العلمي يحتاج إلى مجموعات بيانات مرجعية كبيرة ومتنوعة - تغطي أنواعًا مختلفة من الأجسام وسرعات الحركة وتكوينات الكاميرا - قبل أن تتمكن الحركية بدون علامات من استبدال الطرق التقليدية بشكل كامل في السياقات التنظيمية أو السريرية.
هناك عدة تطورات جديرة بالمتابعة. أولًا، تقترب تقنية الحركة الآنية بدون علامات من الجاهزية للإنتاج، مما قد يُتيح التغذية الراجعة الحيوية المباشرة أثناء إعادة التأهيل أو التدريب الرياضي. ثانيًا، سيؤدي التكامل مع عمليات المحاكاة القائمة على الفيزياء - باستخدام ديناميكيات OpenSim العكسية وتقدير قوة العضلات - إلى توسيع نطاق العملية لتشمل علم الحركة، بالإضافة إلى علم الحركة البحت. ثالثًا، مع تحسين نماذج الوضعيات الأحدث، مثل RTMPose3D، للتنبؤ ثلاثي الأبعاد المباشر من الفيديو أحادي العدسة، قد يصبح استخدام كاميرات متعددة اختياريًا في العديد من حالات الاستخدام.
لا يقتصر هذا الدليل التعليمي على كونه شرحًا تقنيًا فحسب، بل يُشير إلى نقطة تحوّلٍ حاسمة، حيث أصبح التحليل البيوميكانيكي المتطور - الذي كان حكرًا على الأجهزة باهظة الثمن والخبرات المتخصصة - متاحًا الآن لأي شخص يرغب في فتح نافذة متصفح. سواءً كنت تدرس اضطرابات المشي، أو تُحسّن أداء ضربة الجولف، أو تُصمّم الجيل القادم من الصور الرمزية بتقنية الواقع المعزز، فإن أدوات استخراج بيانات الحركة البشرية المهمة من مقاطع الفيديو العادية أصبحت الآن مجانية ومفتوحة المصدر، ولا تحتاج إلا إلى دفتر ملاحظات Colab.