مقدمه
در طول نیم قرن گذشته، فیزیوتراپی در هر دو حوزه علمی و بالینی شاهد رشدی پویا بوده است. همانطور که از تعداد فزاینده مجلات حرفهای با تأثیر بالا و مطالعات تأثیرگذار در سراسر جهان مشهود است، فراتر از پیشرفتهای بالینی، فیزیوتراپی در تحقیقات علمی نیز مورد توجه قرار گرفته است.
علیرغم این پیشرفت، فیزیوتراپیستهای علمی با چالشهای خاصی، بهویژه در مورد ابزارهای تشخیصی و اندازهگیری، مواجه هستند. یکی از مشکلات، فقدان ابزارهای دقیقی است که بتوان آنها را بهطور یکپارچه در تحقیقات ادغام کرد. این امر به پذیرش فناوریهایی از حوزه پزشکی منجر شده است. فیزیوتراپیستها بهصورت موفقیتآمیز از سونوگرافی برای مورفولوژی و ارزیابی فعالیت عضلات [1-7]، الکترومیوگرافی برای کاربردهای مختلف [۸، ۹]، MRI عملکردی برای فعالیتهای حرکتی [۱۰، ۱۱]، بررسی حرکت برای تحرک ستون فقرات و پیکربندی لگن [۱۲-۱۶] و همچنین میوتونومتری [17، 18] و الاستوگرافی [19، 20] برای ارزیابی بیومکانیک بافت و اثرات درمانی [۲۱] استفاده میکنند.
بااینحال، مسئله مهم این است که فناوری پیشرفته ناکافی است، درحالیکه ابزارهای پیشرفته دادههای بسیار دقیقی ارائه میدهند، ممکن است در ثبت جنبههای عملکردی گستردهتر حرکت انسان - که تمرکز اساسی در فیزیوتراپی است - شکست بخورند. در برخی موارد، ارزیابیهای بالینی سادهتر و کاربردیتری برای ارائه یک دیدگاه جامع مورد نیاز است. برای اینکه این آزمونهای پرکاربرد مناسب تحقیقات علمی شوند، ابتدا باید آنها را بهگونهای اصلاح کرد که با استانداردهای روششناختی دقیق همخوانی داشته باشند. این موضوع سؤالهای کلیدی را درباره قابلیت اعتماد تکنیکهای ارزیابی اصلاحشده مطرح میکند.
ارزیابی پایایی آزمونهای بالینی برای اطمینان از دقت، ثبات و کاربردپذیری آنها در تحقیق و عمل بسیار مهم است. آزمونهای قابلاعتماد به پزشکان اجازه میدهند تا تغییرات در انعطافپذیری و عملکرد عضلات را در طول زمان پیگیری کنند و اطمینان حاصل کنند که تفاوتهای مشاهدهشده ناشی از تغییرات فیزیولوژیکی واقعی است و نه خطاهای اندازهگیری. در محیط بالینی، این امر به بهبود تصمیمگیری درمورد تشخیص، برنامهریزی درمان و پیشرفت توانبخشی منجر میشود. در تحقیقات، قابلیت اطمینان بالا برای تولید یافتههای تکرارپذیر و قابلمقایسه ضروری است که اعتبار نتیجهگیریهای علمی را تقویت کرده و از عملکرد مبتنی بر شواهد پشتیبانی میکند. بدون انجام آزمونهای مناسب برای بررسی قابلیت اطمینان، حتی ارزیابیهای پرکاربرد نیز ممکن است نتایج ناهماهنگی را ارائه دهند که به تفسیرهای نادرست و مداخلات نامؤثر منجر شود.
این تحقیق با تمرکز بر تطبیق دو تکنیک ارزیابی طول عضلات بالینی که بهطور گسترده مورد استفاده قرار میگیرند انجام شد: یکی برای عضلات خمکننده زانو (همسترینگ) و دیگری برای عضلات بازکننده زانو (چهار سر ران). این گروههای عضلانی نقش مهمی در مکانیسمهای جبران وضعیت بدن دارند و اغلب تحت تأثیر سبک زندگی بیتحرک در کودکان و نوجوانان قرار میگیرند [۲۲]. کوتاهی عضلات و عدم تعادل قدرت نهتنها در جوانان غیرفعال، بلکه در ورزشکاران جوان نیز اغلب مشاهده میشود [۲۳-۲۵]. درنتیجه، این آزمایشها بخش جداییناپذیری از ارزیابیهای وضعیتی در طول رشد هستند.
نسخههای مختلفی از آزمونهای طول خمکننده و بازکننده زانو در مقالات علمی وجود دارد. بهطور خاص، آزمون خمکنندههای زانو بهطور گسترده مورد مطالعه قرار گرفته است و محققان تکنیکهای اندازهگیری مختلفی را به کار بردهاند که درجات مختلفی از پایایی را به همراه داشته است [۲۲، ۲۶-۳۵]. بااینحال، همچنان نیاز به نسخههای سادهشده، کمهزینه و کاربرپسند که همچنان استانداردهای تحقیقات علمی را برآورده کنند، وجود دارد. علاوهبراین، جنبههای خاصی از پایایی- بهویژه فواصل طولانیتر بین اندازهگیریهای آزمون بازآزمون- در مطالعات قبلی به اندازه کافی بررسی نشدهاند.
بنابراین، هدف این مطالعه ارزیابی قابلیت اطمینان درون و بین ارزیاب آزمونهای اصلاحشده طول انعطافپذیری زانو و کشش زانو، بررسی پایایی آنها در همان روز و همچنین در فواصل ۲ روزه و ۵ روزه در کودکان ۱۰ تا ۱۵ ساله بود. یافتهها مشخص خواهد کرد که آیا نسخههای اصلاحشده آزمونها میتوانند بهطور مؤثر در محیطهای تحقیقاتی علمی اجرا شوند یا خیر؟
مواد و روشها
شرکتکنندگان
82 کودک از سه مدرسه ابتدایی محلی داوطلب شدند، ۴۲ پسر و ۴۰ دختر از کلاسهای چهارم تا هشتم (۱۰ تا ۱۵ سال). شرکتکنندگان عموماً کودکان سالمی بودند که سطوح مختلفی از فعالیت بدنی روزانه (بهجای نشستن، فعالیت تفریحی، فعالیت ورزشی) را انجام میدادند.
معیارهای ورود به مطالعه سن بین ۱۰ تا ۱۵ سال (بهمنظور پوشش کل دوره جهش بلوغ)؛ رشد عصبی و حرکتی طبیعی (بدون تشخیص پزشکی هیچ بیماری یا اختلال عملکردی، بین ۲۵ تا ۷۵ صدک توده بدنی و قد طبیعی براساس سن) و توانایی پیروی از دستورات کلامی بودند. شرکتکنندگان در صورت داشتن سابقه یا تشخیص فعلی هرگونه اختلال ارتوپدی یا عصبی قابلتوجه (مانند شکستگی، ناهنجاریهای مادرزادی، فلج مغزی، یا درد و/یا اختلال عملکرد اسکلتی-عضلانی که بیش از 2 هفته طول بکشد) از مطالعه حذف شدند.
معیارهای خروج دیگر شامل هرگونه سابقه عمل جراحی، موارد اخیر مشکلات جزئی اسکلتی-عضلانی در 1 ماه قبل از مطالعه، یا تجربه شکایات جزئی سلامتی (مانند سرماخوردگی و سردرد) در روز ارزیابی بود. 2 دختر بهدلیل سابقه مداخلات جراحی در ناحیه شکم، و 1 دختر و 3 پسر بهدلیل سابقه شکستگی در اندام تحتانی از مطالعه حذف شدند.
محدوده سنی انتخابشده به چند دلیل انتخاب شد. اولاً، این محدوده شامل کل جهش رشد بلوغ میشود -دورهای که طی آن پزشکان بهطور معمول ارزیابیهای وضعیتی را در کودکان انجام میدهند، ازجمله دو آزمایش طول عضله موردبررسی و زمانی که ناهنجاریهای وضعیتی متعددی معمولاً شناسایی میشوند. تنوع در ویژگیهای وضعیتی شرکتکنندگان به تنوع نتایج کمک کرد و چالشی برای اندازهگیریها ایجاد نمود، درحالیکه همچنین پتانسیل تعمیم نتایج را افزایش داد. به همین دلیل، شرکتکنندگانی با سطوح مختلف فعالیت بدنی روزانه نیز در نظر گرفته شدند.
در نهایت، ۷۶ کودک (۳۷ دختر) که واجد شرایط مطالعه بودند (میانگین سنی 24/13 (۱۰-۱۵) سال، جرم بدن 27/51 (۳۰-۷۲) کیلوگرم، قد بدن 534/1 (35/1-745/1) متر) به همراه والدینشان اطلاعات دقیقی در مورد اهداف و روشها دریافت کردند. والدین همچنین رضایت آگاهانه خود را اعلام کردند. اندازهگیریها در یکی از مراکز دانشگاهی محلی، در آزمایشگاه آنالیز حرکت، انجام شد. در طول انجام اندازهگیریها، هیچ موردی از انصراف ثبت نشد.
حداقل حجم نمونه با استفاده از محاسبهگر حجم نمونه [۳۶] تخمین زده شد. بیشترین تعداد شرکتکننده (۳۵ نفر) برای محاسبات مربوط به آزمون طول عضلات بازکننده زانو براساس یک اندازهگیری مکرر با حداقل ضریب همبستگی درونگروهی (70/0=ICC) و موردانتظار (85/0=ICC)مورد نیاز بود.
طرح مطالعه
این تحقیق مطالعهای فنی با اندازهگیریهای مکرر متغیرهای موردنظر بود که توسط 2 ارزیاب در 3 روز اندازهگیری که با وقفههای ۱ روزه انجام شد (تصویر شماره 1).
برای ثبت تمام مقایسههای در نظر گرفتهشده، پیکانهای خطی باریک (که نمایانگر قابلیت اطمینان بین ارزیاب هستند) که بلوکهای ارزیاب A و ارزیاب B را به هم متصل میکنند، باید به سمت مقابل آینهوار شوند. به همین ترتیب، پیکانهای بلوکی توپر (که قابلیت اطمینان درون ارزیاب را نشان میدهند) که بلوکهای متوالی برای ارزیاب B را به هم متصل میکنند نیز باید بهطور مناسب آینهوار شوند. بهمنظور جلوگیری از تکرار در حین تحلیل دادهها، تمام مقایسههایی که با نوع مشابهی از پیکانها در تصویر شماره ۱ مشخص شده بودند، گردآوری شدند. قابلیت اطمینان درون ارزیاب ۵/۲ به قابلیت اطمینان بین اندازهگیریهای انجامشده توسط همین ارزیاب با فاصلههای ۲ و ۵ روز اشاره دارد، درحالیکه قابلیت اطمینان بین ارزیاب ۵/۲/۰ به قابلیت اطمینان اندازهگیریهایی که توسط ارزیابان مختلف در همان روز و همچنین پس از ۲ و ۵ روز انجام شدهاند، اشاره میکند.
ارزیابان
برای ایجاد محیط آزمایشی سختتر، این مطالعه شامل دو ارزیاب با تجربه حرفهای نسبتاً محدود بود. هر دو فیزیوتراپیست دارای مجوز بودند و هر کدام 5/2 تا 5/3 سال سابقه کار بالینی داشتند. ارزیابان یک برنامه آموزشی فشرده 2 هفتهای (۳ ساعت×3 بار در هفته) را برای کسب مهارت کافی در انجام آزمون طول دو عضله به پایان رساندند. این آموزش توسط متخصصی باتجربه که در مطالعه دخیل نبود، نظارت شد. پس از اتمام، متخصص ارزیابی و تأیید کرد که ارزیابان مهارتهای لازم را برای انجام شایسته نقش خود در تحقیق کسب کردهاند. مهارتهای ارزیابان همچنین در یک مطالعه آزمایشی جزئی که بر روی ۱۵ داوطلب بزرگسال انجام شد، مورد بررسی قرار گرفت. در این مطالعه، کمترین ضریب همبستگی درونگروهی (۳/۳=ICC) ثبتشده برابر با 91/0 بود (ICC بین ارزیابان برای آزمون طول عضلات بازکننده زانو). به دلایل نامشخص، یک دستیار نیز استخدام شد که وظیفهاش خواندن و ثبت مقادیر خواندهشده توسط دستگاههای اندازهگیری بود که از ارزیابان پنهان بودند.
آزمون طول خمکنندههای زانو
فرد موردآزمایش به حالت طاقباز روی کاناپه دراز کشید (تصویر شماره ۲)، درحالیکه لگن و زانوی پای موردآزمایش تا ۹۰ درجه خم شده بود و برای حفظ تعادل، توسط یک چهارپایه کوچک که با دستان فرد در جای خود نگه داشته شده بود، پشتیبانی میشد. دو نقطه مرجع روی قسمت قدامی ساق پا، ۵ سانتیمتر و ۱۵ سانتیمتر پایینتر از کشکک زانو (با زانوی کشیده) علامتگذاری شدند. آهنرباهای نئودیمیوم تخت (با قطر 5/1 سانتیمتر) با نوار چسب به هم متصل شدند و لبههای پروگزیمال آنها با این علامتها همتراز شد تا تنظیمات اندازهگیری ساده شده و خطای دستی به حداقل برسد. یک شیبسنج دیجیتال Baseline 12-1057 (محصولات Baseline، ایالات متحده) بهصورت عمودی کالیبره شد و بهگونهای قرار گرفت که لبه پروکسیمل آن با آهنربای بالایی همراستا باشد. نمایشگر از دید ارزیاب خارج نگه داشته شد. همچنین یک خط افقی بر روی پوست بین مالهها ترسیم شد. نیروی گسترش زانوی غیرفعال با استفاده از یک گیج نیرو Steinberg SBS-KW-300A اعمال شد که در قسمت خلفی پای پایین در خط علامتگذاریشده قرار گرفت. ارزیاب گیج را بهصورت عمود بر پا نگه داشت تا اطمینان حاصل شود که نیروی اعمالشده بهطور یکنواخت است. دستورالعملهای کلامی به این صورت بود: «نفس بکشید، نفس را بیرون دهید، بگذارید پای شما به آرامی بالا بیاید. وقتی احساس کشش قوی اما قابلتحملی در پشت ران خود کردید، بگویید ‘توقف’». یک آزمایش اولیه، نیروی موردنیاز برای رسیدن به نقطه “متوقف” را تعیین کرد. این نیرو در 3 تکرار آزمون تکرار شد. کنترل وزن پای پایین مطابق با یافتههای گوکس و همکاران [۳۰] نادیده گرفته شد. در فرمان “حالا” ، دستیار خواندن شیبسنج را ثبت کرد و از دید ارزیاب جلوگیری شد. این روش برای پای مقابل نیز تکرار شد.
آزمون طول عضلات بازکننده زانو
فرد موردآزمایش بهصورت مورب روی مبل دراز کشید (تصویر شماره ۳). پای موردآزمایش آزادانه از لبه میز آویزان بود، درحالیکه زانو (تقریباً ۹۰ درجه خم شده بود) روی یک چهارپایه قرار داشت. ارتفاع مبل برای راحتی تنظیم شد. شیبسنج به همان روشی که قبلاً توضیح داده شد، تنظیم شد. بهطور مشابه، نیروسنج مانند قبل استفاده شد، اما برای ایجاد خم شدن غیرفعال زانو، به قسمت قدامی ساق پا اعمال شد. ارزیاب دستورالعملهای زیر را ارائه داد: «دم، بازدم کنید و اجازه دهید پای شما به آرامی به سمت بالا حرکت کند. در پایان، وقتی کشش قوی اما قابلتحملی، نه درد، در جلوی ران خود احساس کردید، بگویید «توقف». همانند آزمون خمکنندهها، یک آزمایش اولیه نیروی موردنیاز برای رسیدن به نقطه «توقف» را تعیین کرد و ثبات در تکرارهای بعدی را تضمین نمود. آزمون طول عضله واقعی شامل سه تکرار بود که طی آن، ارزیاب سطح نیروی ثبتشده قبلی را تکرار میکرد. با دستور «حالا»، دستیار، عدد شیبسنج را ثبت کرد که باز هم برای ارزیاب مبهم بود. پس از آزمایش یک پا، این روش در سمت مقابل تکرار شد.
پس از مصاحبه مقدماتی و تأیید معیارهای انتخاب، هفته مناسب برای اندازهگیریها توسط والدین و کودکان انتخاب شد. آنها بعدازظهر پس از حداقل ۳ ساعت استراحت پس از مدرسه و حداقل ۲ ساعت پس از آخرین وعده غذایی در آزمایشگاه حاضر شدند. از کودکان خواسته شد لباسهای بدون محدودیت بپوشند و با استفاده از دوچرخه ثابت بهمدت ۱۰ دقیقه با شدت کم بدن خود را گرم کنند. سپس، به آزمودنیها اطلاعاتی در مورد نحوه همکاری در طول اجرای آزمون داده شد و ۲-۳ تلاش از هر آزمون معرفی شد. بااینحال، این تلاشها بدون بررسی کامل دامنه حرکتی آزمودنیها انجام شد. ترتیب آزمونها برای شرکتکننده موردنظر بهطور تصادفی در اولین روز اندازهگیری (دوشنبه) تعیین شد و در روزهای متوالی اندازهگیری (چهارشنبه، جمعه همان هفته) بدون تغییر باقی ماند.
ترتیب قرارگیری طرفین بدن همیشه از راست به چپ بود. حروف A و B بهصورت تصادفی به ارزیابان اختصاص داده شدند. پس از این، ترتیب ارزیابان همیشه از A تا B باقی ماند. روز دوشنبه، پس از آمادهسازی مناسب آزمودنیها، دو آزمون طول عضله توسط ارزیاب A، هر کدام 3 بار، تکرار شد. سپس، تمام علامتهای روی پوست آزمودنیها، آهنرباهای متصل و غیره، برداشته شدند و آزمودنیها بهمدت ۱۵ دقیقه در حالت نیمه نشسته و آرام روی صندلی راحتی استراحت کردند. متعاقباً، ارزیاب B دوباره آزمودنیها را برای اندازهگیریهای خود آماده کرد و 2 آزمایش 1 بار دیگر، هر کدام 3 بار، تکرار شد. کل این مراحل بهطور یکسان در روزهای چهارشنبه و جمعه تکرار شد (تصویر شماره ۱). به شرکتکنندگان گفته شد سطح فعالیت بدنی معمول خود را در طول کل هفته اندازهگیری حفظ کنند و از ایجاد هرگونه تغییر ناگهانی در فعالیت معمول خود خودداری کنند.
پردازش دادهها
دادههای ثبتشده توسط دو ارزیاب در صفحه گسترده Statistica 13 (Statistica ،تولسا، ایالات متحده آمریکا) جمعآوری شد. بهمنظور محاسبه شاخصهای پایایی برای انواع مختلف پایایی (تصویر شماره 1) و برای جلوگیری از افزونگی نتایج، این پایگاه داده بهطور خاص بازسازی شد. مقایسههای مشخصشده براساس طرح زیر تجمیع شدند:
قابلیت اطمینان درون ارزیاب، با فاصله ۲ روز بین اندازهگیریهای متوالی
ارزیاب A در روز دوشنبه در مقابل ارزیاب A در روز چهارشنبه + ارزیاب A در روز چهارشنبه در مقابل ارزیاب A در روز جمعه + ارزیاب B در روز دوشنبه در مقابل ارزیاب B در روز چهارشنبه + ارزیاب B در روز چهارشنبه در مقابل ارزیاب B در روز جمعه؛ مجموع ۳۰۴ رکورد.
قابلیت اطمینان درون ارزیاب، با فاصله ۵ روز بین اندازهگیریهای متوالی
ارزیاب A در روز دوشنبه در مقابل ارزیاب A در روز جمعه+ارزیاب B در روز دوشنبه در مقابل ارزیاب B در روز جمعه؛ مجموع ۱۵۲ رکورد.
قابلیت اطمینان بین ارزیاب، اندازهگیریها در همان روز انجام شده است
ارزیاب A در روز دوشنبه در مقابل ارزیاب B در روز دوشنبه + ارزیاب A در روز چهارشنبه در مقابل ارزیاب B در روز چهارشنبه + ارزیاب A در روز جمعه در مقابل ارزیاب B در روز جمعه؛ مجموع ۲۲۸ رکورد.
قابلیت اطمینان بین ارزیاب، با فاصله ۲ روز بین اندازهگیریهای متوالی
ارزیاب A در روز دوشنبه در مقابل ارزیاب B در روز چهارشنبه+ارزیاب A در روز چهارشنبه در مقابل ارزیاب B در روز جمعه+ارزیاب B در روز دوشنبه در مقابل ارزیاب A در روز چهارشنبه+ارزیاب B در روز چهارشنبه در مقابل ارزیاب A در روز جمعه؛ مجموع ۳۰۴ رکورد.
قابلیت اطمینان بین ارزیاب، با فاصله ۵ روز بین اندازهگیریهای متوالی
ارزیاب A در روز دوشنبه در مقابل ارزیاب B در روز جمعه +ارزیاب B در روز دوشنبه در مقابل ارزیاب A در روز جمعه؛ مجموع ۱۵۲ رکورد.
تحلیل آماری
از مدل آنووا عاملی برای مقایسه میانگینهای آزمونهای طول عضله که توسط دو ارزیاب در روزهای اندازهگیری متوالی به دست آمدند، استفاده شد. در این مدل، روز اندازهگیری، ارزیاب و سمت بدن بهعنوان عوامل مستقل در نظر گرفته شدند.
برای محاسبه ICC، از آنووا مدل مختلط استفاده شد که در آن عامل تکراری اندازهگیریهای متوالی و عامل مستقل، افراد بودند. قابلیت اطمینان اندازهگیریهای انجامشده در همان روز توسط یک ارزیاب بهطور جداگانه گزارش نشده است، زیرا بهطور ذاتی در سایر اشکال قابلیت اطمینان درون ارزیاب گنجانده شده است (تصویر شماره ۱). از مدل ۲،k از ICC به کار گرفته شد تا امکان تعمیم نتایج به کل جمعیت ارزیابان مشابه فراهم شود. ICCها بهطور جداگانه برای نتایج یک تکرار از آزمون طول عضله دادهشده، 2 تکرار (مقدار میانگین) و 3 تکرار (مقدار میانگین) محاسبه شدند. علاوهبراین، خطاهای استاندارد اندازهگیری (SEM) با استفاده از فرمول شماره 1 همراه با کوچکترین تفاوتهای قابلشناسایی محاسبه شدند (فرمول شماره2). تفسیر مقادیر ICC به این ترتیب بود: 00/0-50/0=ضعیف، 50/0-75/0=متوسط، 75/0-90/0=خوب و 90/0-00/1=قابلیت اطمینان عالی [۳۷].
1. (SEM=SD×(1-ICC)½)
2. (SDD=1/96×2½)
یافتهها
در جدول شماره ۱، آمار توصیفی نتایج دو آزمون طول عضله موردنظر که توسط هر دو ارزیاب در روزهای اندازهگیری متوالی ثبت شده، ارائه شده است. برای تمامی اثرات اصلی آنووا (روز اندازهگیری، ارزیاب، سمت بدن) و همچنین تعاملات آنها، هیچ تفاوت معنیداری مشاهده نشد (همه 05/0
دو آزمون طول عضله موردنظر، قابلیت اطمینان خوب تا عالی را نشان دادند، بدون توجه به اینکه اندازهگیریها توسط همان ارزیاب با فاصله ۲ یا ۵ روز انجام شده باشد (جدول شماره ۲) یا توسط ارزیابان مختلف در همان روز و همچنین با فاصله ۲ یا ۵ روز (جدول شماره ۳). پایینترین ICC محاسبهشده برابر با 79/0مربوط به آزمون طول خمکنندههای زانو در سمت چپ بدن بود (SEM=47/5، SDD=17/15) درجه؛ قابلیت اطمینان بین ارزیاب براساس یک اندازهگیری تکراری که با فاصله ۵ روز انجام شد). در تمامی موارد باقیمانده، ICCهای بالاتر از 80/0 بهدست آمد.
در مورد قابلیت اطمینان درون ارزیاب (جدول شماره ۲)، حتی یک اندازهگیری مکرر نیز برای بهدست آوردن ICCهای بالاتر از 87/0 کافی بود. افزایش تعداد اندازهگیریهای مکرر باعث افزایش بیشتر مقادیر ICC شد. در طول 3 آزمایش تکراری، مقادیر ICC به 94/0 رسید یا از آن فراتر رفت. کاهش تدریجی و همزمان در مقادیر SEM و SDD نیز ثبت شد.
ضرایب همبستگی درونگروهی (فاصله اطمینان ۹۵% ± ICC) که با استفاده از مدلهای 1، 2 برای اندازهگیریهای تکی، ۲، ۲ برای 2 تکرار و ۲، ۳ برای 3 اندازهگیری مکرر محاسبه شدهاند، گزارش شدهاند. علاوهبراین، خطای استاندارد اندازهگیری (SEM) و کوچکترین تفاوت قابلتشخیص (SDD) ارائه شدهاند. پایایی درون ارزیاب ۲ به ثبات اندازهگیریهای انجامشده توسط یک ارزیاب با فاصله ۲ روزه (مثلاً دوشنبه تا چهارشنبه و چهارشنبه تا جمعه) اشاره دارد، درحالیکه پایایی درون ارزیاب ۵ مربوط به اندازهگیریهای انجامشده با فاصله ۵ روزه (مثلاً دوشنبه تا جمعه) است (تصویر شماره ۱).
برای پایایی بین ارزیاب (جدول شماره ۳)، مقادیر ICC پایینتری بهخصوص با فاصله زمانی طولانیتر بین اندازهگیریها به دست آمد. اغلب این اتفاق میافتاد که یک اندازهگیری مکرر، ICCهایی کمتر از 90/0 را نشان میداد (کمتر از 80/0 در یک مورد که قبلاً در این بخش ذکر شد). افزایش تعداد اندازهگیریهای مکرر باعث افزایش قابلتوجه مقادیر ICC شد.
با 3 اندازهگیری مکرر، تمام ICCها، حتی آنهایی که برای اندازهگیریهای انجامشده با وقفه ۵ روزه محاسبه شدهاند، بالاتر از 90/0 بودند. مجدداً، تمام SEMها و SDDها بهتدریج کاهش یافتند.
برای هر نوع قابلیت اطمینان تحت بررسی، افزایش تعداد اندازهگیریهای مکرر باعث باریک شدن تدریجی فواصل اطمینان ICCها شد، حتی زمانی که مقدار ICC دیگر بهطور قابلتوجهی افزایش نمییافت. مقادیر زیر ارائه شدهاند:
ضرایب همبستگی درونگروهی (فاصله اطمینان۹۵%±ICC)، براساس مدل 1، 2 برای اندازهگیریهای تکی، ۲، ۲ برای 2 اندازهگیری مکرر و ۲، ۳ برای 3 اندازهگیری مکرر، خطای استاندارد اندازهگیری (SEM) و کوچکترین تفاوت قابلتشخیص (SDD). پایایی بین ارزیاب (0) به اندازهگیریهای انجامشده توسط ارزیابان مختلف در همان روز اشاره دارد، درحالیکه پایایی بین ارزیاب ۲ نشاندهنده اندازهگیریهای انجامشده با فاصله ۲ روزه (مثلاً دوشنبه-چهارشنبه وچهارشنبه-جمعه) و پایایی بین ارزیاب ۵ مربوط به فاصله ۵ روزه (مثلاً دوشنبه-جمعه) است (تصویر شماره ۱).
بحث
نتایج مطالعه حاضر نشان میدهد دو آزمون اصلاحشده طول عضله برای آزمونهای خمکنندههای زانو و بازکنندههای زانو، سطح بسیار رضایتبخشی از پایایی را نشان میدهند (برای ۳ اندازهگیری مکرر، تمام ICCهای محاسبهشده بالاتر از 90/0 بودند). این یافته نشاندهنده کارایی این آزمونها در محیطهای تحقیقات علمی پشتیبانی است و جایگزینی قابلاعتماد برای ابزارهای تکنولوژیکی بسیار پیچیده میباشند. این ابزارها ممکن است گاهی اوقات نتوانند جنبههای عملکردی گستردهتر حرکت انسان را که آزمایشهای بالینی میتوانند به آنها بپردازند، به تصویر بکشند. این یافتهها بهویژه برای محققانی که قصد دارند اندازهگیریهای بالینی را در مطالعات خود پیادهسازی کنند، مفید است، جایی که روشهای سادهتر و در دسترستر ترجیح داده میشوند.
ازنظر پایایی مطلق، SDD ما برای 3 اندازهگیری مکرر، حداکثر 93/9 درجه برای خمکنندههای زانو و 48/4درجه برای بازکنندههای زانو بود، درحالیکه پیامدهای بالینی یا علمی این مقادیر به شرایط بستگی دارد، مشاهده شد تفاوت بین ارزیابها یا در روزهای مختلف کمتر از SDDها بود که نشان میدهد اندازهگیریها در طول زمان پایدار و ثابت ماندهاند. این امر، استحکام ابزارهای اصلاحشده ما را برجسته میکند و پشتیبانیکننده استفاده از آنها برای ارزیابیهای بالینی و علمی قابلاعتماد است.
مطالعه حاضر تحت شرایط چالشبرانگیزی انجام شد که ممکن است بر قابلیت اطمینان تأثیر منفی بگذارد. افراد موردمطالعه در اواسط دوران بلوغ بودند، دورهای که با تغییرات سریع و غیرقابلپیشبینی در مورفولوژی و عملکرد مشخص میشود. علاوهبراین، فواصل طولانی بین آزمونها (تا 5 روز) در نظر گرفته شد و از دو ارزیاب نسبتاً بیتجربه که تحت یک دوره آموزشی کامل قرار گرفته بودند، استفاده شد. علیرغم این چالشهای بالقوه، یافتههای ما قابلیت اطمینان بسیار خوبی را نشان داد و استفاده از این آزمونهای اصلاحشده را هم در عمل بالینی و هم در کاربردهای تحقیقاتی تأیید کرد.
آزمون طول خمکننده زانو اغلب موردتوجه محققان در سراسر جهان است. بهطورکلی، نتایج ما با نتایج مطالعات قبلی همسو است؛ بااینحال، توانستیم جنبههایی از پایایی آزمون را که قبلاً بررسی نشدهاند، بررسی کنیم، درحالیکه بسیاری از مطالعات بر پایایی درون ارزیاب و اندازهگیریهای انجامشده در همان روز تمرکز دارند، دادهها در مورد پایایی بین ارزیاب و فواصل طولانیتر آزمون بازآزمون محدود هستند. تاآنجاکه میدانیم، حمید و همکاران [۳۸] تنها نویسندگانی هستند که پایایی بین ارزیاب را برای این آزمون با فاصله یک هفته گزارش کردهاند. آنهاICC [1، 2] را 081/0-87/0 ثبت کردند که با نتایج ما (بین ارزیابان در 5 روز) قابلمقایسه است، اگرچه فواصل اطمینان آنها بسیار گستردهتر بود و از 32/0 تا 92/0 متغیر بود. این اختلاف احتمالاً بهدلیل حجم نمونه کوچک آنها (۱۴ نفر) و عدم اندازهگیریهای مکرر است (آنها فقط اندازهگیریهای تکی انجام دادند). درنتیجه، میتوانیم ادعا کنیم که روش ما تخمینهای دقیقتری از ICCهای واقعی برای این اندازهگیری ارائه میدهد که بهویژه در محیطهای تحقیقات علمی اهمیت دارد. علاوهبراین، تیم ما قبلاً پایایی بین ارزیاب آزمون خمکننده زانو را گزارش کرده است [۲۹]، اگرچه آن اندازهگیریها توسط دو ارزیاب در همان روز انجام شده است، اما از آن زمان، ما متدولوژی خود را با معرفی یک گیج تنش و تکنیک اعمال نیرو که برای کاربر “دوستدارتر” باشد و همچنین یک روش متفاوت برای تعیین نقطه پایانی حرکت، بهبود بخشیدهایم.
علاوهبراین، از ابزاری ساده برای پشتیبانی از ساق پای آزمودنیها استفاده کردیم که در مقایسه با دستگاههای مورداستفاده در سایر مطالعات [۳۳، ۳۸] حتی سادهتر به نظر میرسد. علاوهبراین، دادههای موجود در مقالات اغلب از نمونههای کوچک جمعآوری میشوند [26، 27، 29، 30، 38]. گاهی نویسندگان از روشهای نامناسبی برای تعیین نقطه پایانی حرکت [33] یا از ابزارهای پیچیده برای کنترل حرکت لگن استفاده میکنند [۲۶، ۳۱]. همانطور که نتایج ما نشان میدهد، به نظر نمیرسد چنین اقداماتی برای دستیابی به اندازهگیری زاویهای قابلاعتماد در آزمون طول خمکنندههای زانو ضروری باشند.
دادههای موجود در مورد آزمون طول عضله بازکننده زانو تا حدودی محدود است. گاجدوسیک [۲۸] با استفاده از اندازهگیریهای گونیامتری، پایایی بسیار خوبی را نشان داد، اما مطالعه او شامل یک ارزیاب واحد بود که اندازهگیریها را در همان روز با تنها ۱۵ آزمودنی انجام میداد. تیم ما [۲۹] قبلاً دادههایی در مورد پایایی درون و بین ارزیاب برای این آزمون ارائه کرده بود، اما باز هم، همه اندازهگیریها در 1 روز با حجم نمونه کوچک ۱۴ آزمودنی انجام شد. در مطالعه حاضر، این محدودیتها را با استفاده از یک کرنشسنج متفاوت و دوباره با یک روش اصلاحشده برای تعیین نقطه پایانی حرکت، برطرف کردیم. همچنین تصمیم گرفتیم از تثبیت خارجی لگن استفاده نکنیم، زیرا دریافتیم که تثبیت ایجادشده توسط چرخش متقابل دو استخوان لگن کافی است (تصویر شماره ۳). تمام دادههای دیگر مربوط به آزمون طول بازکنندههای زانو که در این مطالعه ارائه شده است، جدید است.
برای ارائه توصیههایی درمورد استفاده از دو آزمون طول عضله، پیشنهاد میکنیم در محیطهای علمی، انجام 3 اندازهگیری تکراری از آزمون مفید خواهد بود، بهویژه زمانی که فاصله زمانی طولانیتری بین آزمونها و بازآزمونها وجود دارد (تا ۵ روز در این مطالعه) یا زمانی که آزمونها و بازآزمونها توسط ارزیابان مختلف انجام میشود. در شرایطی که فاصله زمانی کوتاهتر است و/یا یک ارزیاب واحد وجود دارد، 2 اندازهگیری مکرر ممکن است کافی باشد. کاهش تعداد اندازهگیریهای مکرر به کمتر از 2 را توصیه نمیکنیم، درحالیکه این رویکرد ممکن است در یک محیط بالینی قابلقبول باشد (با فرض اینکه پزشک آموزش مناسب دیده و بهطور دقیق به پروسه پایبند باشد)، جایی که الزامات قابلیت اطمینان کمی انعطافپذیرتر است، باتوجهبه اینکه برای یک اندازهگیری مکرر، پایینترین ICC که ثبت کردیم 79/0 بود (برای آزمون طول خمکنندههای زانو، قابلیت اطمینان بین ارزیاب با فاصله ۵ روز)، همچنان نتیجهای رضایتبخش برای استفاده بالینی است. همچنین فراتر از یک نقطه خاص، افزایش تعداد اندازهگیریهای مکرر به افزایش بیشتر مقدار ICC منجر نمیشود، اما به محدود کردن فاصله اطمینان ICC کمک میکند. این پدیده از دیدگاه علمی سودمند است، زیرا دقت تخمینهای قابلیت اطمینان را افزایش میدهد.
نتیجهگیری
پس از اصلاحات خاص مناسب، امکان دستیابی به سطح بسیار خوب و عالی از پایایی آزمونهای طول خمکنندهها و بازکنندههای زانو وجود دارد. با استفاده از 3 اندازهگیری مکرر، تمام ICCهای ثبتشده بالاتر از 90/0 بودند. چنین سطح پایایی بالایی، استفاده از نسخههای اصلاحشده آزمونها را در محیطهای علمی توجیه میکند. برای دستیابی به این هدف، نیازی به تجهیزات پیشرفته یا هزینههای زمانی، شخصی و اقتصادی بالا نیست.
محدودیتها
یکی از محدودیتهای مطالعه ما، اعتبار خارجی محدود آن است، زیرا نمونه فقط شامل نوجوانان بود. آزمونهای خمکنندهها و بازکنندههای زانو اغلب در ارزیابیهای وضعیتی در این مرحله رشدی استفاده میشوند، اما هنگام تلاش برای تعمیم این یافتهها به سایر گروههای سنی، احتیاط لازم است. باوجوداین، اصلاحاتی که به کار بردیم مزایایی ازجمله هزینه کم، حداقل تجهیزات (گونیومتر دیجیتال و نیروسنج) و کاهش نیاز به پرسنل داشت که قابلدسترس در محیطهای مختلف است. علاوهبراین، نتایج ما نشان میدهد که آزمایشهای اصلاحشده را میتوان بدون نیاز به ابزارهای پیچیده یا گرانقیمت مانند اشعه ایکس یا سیستمهای تحلیل حرکت اجرا کرد. درنهایت، تصمیم گرفتیم ICCها را برای مدل ۲,k ارائه دهیم که امکان تعمیم وسیعتری را در بین ارزیابان مختلف فراهم میکند، هرچند که در مدل ۳,k احتمالاً قابلیت اطمینان بالاتری را نشان میدهد. قابلیت اطمینان درون ارزیاب را برای اندازهگیریهای همان روز ارائه ندادیم، زیرا این موضوع بهطور ذاتی در قابلیت اطمینانهای بالاتر منعکس شده است، جایی که بهدلیل کاهش واریانس، مقادیر ICC بالاتری را مشاهده میکنیم.
نتایج امیدوارکنندهی این مطالعه، راههای متعددی را برای تحقیقات آینده در مورد قابلیت اطمینان و کاربرد آزمونهای اصلاحشده طول عضله بالینی، بهویژه برای استفاده در عمل بالینی و تحقیقات علمی، باز میکند. نقاط کلیدی تحقیقات آینده ممکن است شامل موارد زیر باشد: دامنه سنی وسیعتری از شرکتکنندگان و جمعیتهای مختلف (مانند ورزشکاران جوان)، شرایط بالینی متنوع (مانند فلج مغزی، دیستروفیهای عضلانی و غیره)، دورههای پیگیری طولانیتر، بررسیهای مربوط به اعتبار آزمونها و درنهایت، گنجاندن آنها در آزمایشها به عنوان ابزارهای اندازهگیری.
ملاحظات اخلاقی
پیروی از اصول اخلاق پژوهش
این مطالعه در کمیته اخلاق تحقیقات زیست پزشکی نهادی، با شماره تصویب ۱۸/۲۰۲۰، تأیید شده است.
حامی مالی
این پژوهش هیچگونه کمک مالی از سازمانیهای دولتی، خصوصی و غیرانتفاعی دریافت نکرده است.
مشارکت نویسندگان
مفهومسازی، منابع، نگارش-تهیه و نگارش پیشنویس اصلی-بررسی و ویرایش: همه نویسندگان؛ روششناسی و نظارت: رافال گنات، آنا گوگولا و توماش ولنی؛ نرمافزار: رافال گنات؛ اعتبارسنجی، تحلیل رسمی و مدیریت پروژه: رافال گنات و آنا گوگولا؛ تحقیق: آنا گوگولا؛ سرپرستی دادهها: آگنیشکا پولاچک و پیوتر ووزنیاک؛ تجسم: رافال گنات، آگنیشکا پولاچک و پیوتر وونیاک.
تعارض منافع
بنابر اظهار نویسندگان، این مقاله تعارض منافع ندارد.