Dołącz do czytelników
Brak wyników

Z praktyki gabinetu

27 września 2021

NR 129 (Wrzesień 2021)

Ruchowe testy palpacyjne w ocenie dysfunkcji stawu krzyżowo-biodrowego. Stopień ich trafności i rzetelności w próbach klinicznych – cz. 2

0 21

W drugiej części artykułu dotyczącego roli ruchowych testów palpacyjnych w diagnostyce dysfunkcji stawu krzyżowo-biodrowego zostanie omówiona rzetelność i trafność przeprowadzonych prób. Na podstawie dostępnej literatury autor dokona przeglądu wyników badań dla rozpoznania dysfunkcji stawu krzyżowo-biodrowego (SIJD), przeprowadzona dyskusja pozwoli zaś dokonać oceny ich wartości oraz konkluzji dotyczącej implikacji klinicznych.

Według Osińskiego w kryteriach poprawności testów (pomiarów) coraz szersze uznanie zaczyna zdobywać pogląd, że w pełni wiarygodnie można je oceniać jedynie wtedy, kiedy są one w szczególności trafne i rzetelne [1]. Domholdt [2] zdefiniował trafność naukową jako stopień, w jakim konkluzje płynące z wyników badania zasługują na zaufanie i są użyteczne. Próbą trafną jest taka, która mierzy oczekiwaną właściwość, a więc tę, którą miała mierzyć.
Trafność próby (validity) ma wiele aspektów. W interpretacji omawianych ruchowych testów palpacyjnych według zespołu terapeutów manualnych z Kanadyjskiego Instytutu Chiropraktycznego istotne są trzy aspekty ich trafności naukowej: fasadowa, treściowa i kryterialna [3, 4]. Każda z nich charakteryzuje się pewnym określonym sposobem sprawdzania trafności. Szersze omówienie tego zagadnienia zainteresowany Czytelnik znajdzie w odpowiednich pozycjach literatury [5–7].
Tradycyjnie trafność określa się za pomocą współczynnika K. Wyraża on związek między danymi otrzymanymi za pośrednictwem testu a danymi kryterialnymi. Pozwala on na określenie, z jakim stopniem pewności pomiar testowy może być stosowany jako podstawa diagnozy lub prognozy [3].
Zatem współczynnikiem trafności K będzie wartość bezwzględna korelacji między danymi otrzymanymi w teście x z jednej strony i kryteriami y z drugiej.

POLECAMY

Kxy

Określa on więc związek między danymi testowymi a otrzymanymi na podstawie kryterium. Oznacza stopień, w jakim można z jego wyniku wyciągnąć w drodze interpretacji znaczące wnioski.
Test nietrafny nie tylko jest bezwartościowy, ale też może zniekształcić ocenę poziomu natężenia badanej cechy.
Rzetelność (ang. reliability) próby informuje o wielkości błędu pomiaru. Z tym pojęciem wiąże się stabilność wyników uzyskiwanych przez badane osoby w pomiarach powtarzalnych. Jest koniecznym, ale niewystarczającym warunkiem trafności. Test nierzetelny nie może być trafny, ale test rzetelny trafnym być nie musi [1]. 
Metoda powtórnego testu (ang. test-retest) oraz ocena zgodności wyników pomiarów uzyskanych przez jednego badającego/różnych badających (ang. intra-rater/inter-rater reliability) to dwie główne metody oceny rzetelności próby [8]. Rzetelność mierzona metodą powtórnego testu oznacza stałość wyników pomiarów, powtarzanych po upływie pewnego czasu w sytuacji, gdy w przedmiocie pomiarów w miarę upływu czasu nie mogły zajść jakiekolwiek zmiany [8]. Zgodność wyników uzyskana przez tego samego badającego oznacza stabilność wyników pomiarów dokonywanych przez tę samą osobę w trakcie dwóch lub więcej prób. Zgodność wyników uzyskana przez różnych badających dotyczy poziomu podobieństwa pomiędzy wynikami uzyskanymi przez dwóch lub więcej badających, którzy dokonują oceny tej samej grupy obiektów [4].
Słaba rzetelność mierzona metodą powtórnego testu może być źródłem niedostatecznej zgodności wyników uzyskanych przez jednego badającego i różnych badających. Przekreśla lub co najmniej poważnie ogranicza użyteczność danej próby jako narzędzia pomiarowego. 
Wielkość wskaźnika rzetelności jest w pewnej mierze miarą współczynnika korelacji między wynikami uzyskanymi w kolejnych powtórzeniach w tej samej próbie. Próba winna wykazać się mniejszą przydatnością w przewidywaniu lub szacowaniu jakiejś innej próby niż koreluje ona sama ze sobą. Współczynnik rzetelności może przyjmować wartości między 0 i 1, a więc nigdy nie ma wartości ujemnej [1].
Dogłębne omówienie tematyki współczynnika rzetelności pomiarów i ich orientacyjnych przedziałów dla potrzeb wyników testów diagnostycznych dysfunkcji stawu biodrowo-krzyżowego przedstawił Huijbregts [3].
 

0,95–0,99 rzetelność doskonała
0,90–0,94 rzetelność dobra
0,80–0,89 rzetelność dopuszczalna
0,70–0,79 rzetelność bardzo słaba
0,60–0,69 rzetelność wątpliwa


Dyskusja

Trafność kryterialną testu zgięcia stawu biodrowego w pozycji stojącej Sturesson i wsp. ocenili na podstawie badań 22 pacjentów z SIJD przeprowadzonych przez czterech badających [9]. Oceną standardową była rentgenowska analiza stereofotogrametryczna. Na jej podstawie wykazano, że ruchy, które mają miejsce podczas przeprowadzania standing hip flexion test, są zbyt małe, aby można je było wykryć manualnie. W konkluzji autorzy stwierdzają, że test zgięcia stawu biodrowego w pozycji stojącej nie może być polecany do oceny ruchomości SIJ. 
Riddle i wsp. [10] na podstawie wyników uzyskiwanych przez różnych badających ocenili ich trafność w trakcie trzech ruchowych testów palpacyjnych: zgięcia tułowia w pozycji stojącej, wyprostu stawu biodrowego oraz przejścia do pozycji siedzącej z leżenia tyłem. Wartości współczynnika trafności K z błędem standardowym wyniosły odpowiednio: 0,32 (0,09), 0,26 (0,10) oraz 0,19 (0,09). Autorzy konkludują, że wartości K dla poszczególnych testów okazały się zbyt niskie, by uzasadnić ich kliniczne zastosowanie. 
Bowman i Gibble [11] badali zgodność wyników uzyskiwanych przez różnych badających podczas testu zgięcia tułowia w pozycji stojącej. Badaną grupę tworzyło siedmiu pacjentów bez dolegliwości i dziewięciu z bólami dolnego odcinka lędźwiowego kręgosłupa. Chorzy z ostrymi dolegliwościami bólowymi byli wykluczeni z udziału w badaniach. W analizie statystycznej wykorzystano wartość współczynnika „K” oraz ich procentową zgodność.
 

Procentowe wzorcowe wartości zgodności współczynnika „K” (3)
< 40% zgodność od słabej do średniej
40–60% zgodność umiarkowana
60–80% zgodność znaczna
> 80% zgodność znakomita
100% zgodność doskonała


Zgodność ocen różnych badających wynosiła 52%, wartość „K” – 0,2333. Autorzy wyciągnęli wniosek, że istnieje potrzeba wykorzystywania testów o większej rzetelności celem określenia istotności klinicznej stawu krzyżowo-biodrowego.
Carmichael [12] badał zgodność wyników testu zgięcia stawu biodrowego w pozycji stojącej uzyskanych przez jednego badającego oraz przez różnych badających. Badana grupa składała się z 54 studentów; wykluczono uczestników z umiarkowanym bądź silnym bólem podudzia, pośladka lub krzyża. Oceniano cztery odruchy jednostronnych kontaktów manualnych obu rąk. Skala ocen była jakościowa (dychotomiczna): zablokowanie lub brak zablokowania. Analizę statystyczną przeprowadzono z wykorzystaniem procentowej zgodności wyników oraz współczynnika K. Średnia sumaryczna zgodność wyników uzyskanych przez jednego badającego w przypadku zablokowania wyniosła 89,2% (K = 0,180), średnia indywidualna zgodność wyników jednego badającego – 89,9% (K = 0,314). Wartości K dla różnych badających wahały się od -0,0650 do 0,1930, natomiast średnia procentowa zgodność wyników = 85,3%. Kontakt manualny w górnej części stawu krzyżowo-biodrowego cechował się wyższymi wartościami znamionującymi rzetelność. Konkludując, test zgięcia stawu biodrowego w pozycji stojącej odznacza się umiarkowaną rzetelnością wówczas, gdy ten sam badający dokonuje seryjnej oceny u tego samego pacjenta.
Oceniając trafność treściową czterech ruchowych testów palpacyjnych; zgięcie stawu biodrowego, zgięcie tułowia, wyprost w stawie biodrowym, przejście z leżenia tyłem do siadu, Levangie [13] jako miarę statystyczną zastosowała iloraz szans z 95% CI. Zamieszczanie 95% CI pozwala sprawdzić, co to jest iloraz szans, czy możliwe wartości danego współczynnika statystycznego zawierają takie, które mogą przypominać rezultaty zgodności przypadkowej, lub takie, które nie mają znaczenia dla zmiany prawdopodobieństwa sprzed testu. 

W badaniu zastosowano skalę oceny jakościowej testu: wynik dodatni lub ujemny. W przypadku testu zgięcia stawu biodrowego w pozycji stojącej iloraz szans oraz 95% CI wynosiły 4,57 – dla zgięcia tułowia w pozycji stojącej, 0,77 – dla wyprostu stawu biodrowego, 1,52 – dla przejścia z leżenia tyłem do pozycji siedzącej. Autorka wnioskuje, że jedynie test zgięcia stawu biodrowego w pozycji stojącej wykazywał związek z bólami krzyża, i sugeruje, że test ten może poddawać ocenie niedostateczną ruchomość stawu krzyżowo-biodrowego jako przyczynę bólu krzyża. Konkluduje również, iż testy zgięcia tułowia w pozycji stojącej oraz wyprostu stawu biodrowego w pozycji stojącej nie odpowiadają za identyczne zjawiska.
Cibulka i Koldehoff [14] w swych publikacjach uznali, że dysfunkcja stawu krzyżowo-biodrowego jest obecna, jeśli co najmniej trzy z czterech testów były dodatnie. Jednakże wnioski płynące z poszczególnych testów nie muszą być podobne – badający mogą dochodzić do całkowicie odmiennej diagnozy w kwestii nie tylko strony, ale i rodzaju wadliwego położenia kości biodrowej w procesie patologii stawu krzyżowo-biodrowego.
Zgodność ocen uzyskanych przez różnych badających podczas ruchowych testów palpacyjnych była przedmiotem badań Rozenberga i wsp. [15]. Oceniane testy obejmowały zgięcie tułowia w pozycji stojącej z wyprostem stawu biodrowego, zgięcie stawu biodrowego, zgięcie stawu biodrowego oraz przejście z leżenia tyłem do siadu. Zastosowano trzypunktową skalę ocen pozwalającą na wybór pomiędzy wynikiem dodatnim po stronie lewej, dodatnim po stronie prawej albo wynikiem normalnym. Zgodność wyników uzyskanych przez różnych badających dla testu zgięcia tułowia w pozycji stojącej wynosiła 43,75%, dla testu zgięcia stawu biodrowego w pozycji stojącej – 46,67%, dla testu wyprostu stawu biodrowego – 50,00%, dla testu przejścia do pozycji siedzącej z leżenia tyłem – 40,00%. Ponieważ żaden z omawianych testów nie osiągnął poziomu istotności statystycznej (zgodność 70 lub 90%), autorzy wnioskują, że dla podejmowania decyzji klinicznych ruchowe testy palpacyjne nie odznaczają się dostateczną rzetelnością.
Vincent-Smith i Gibbons [16] badali zgodność wyników uzyskiwanych przez jednego badającego i przez różnych badających w trakcie testu zgięcia tułowia w pozycji stojącej z obustronnym kontaktem manualnym kolców biodrowych tylnych górnych. Zastosowana skala ocen: wynik ujemny, wynik dodatni po prawej, wynik dodatni po lewej. Badania prowadziło dziewięciu osteopatów. Badaną grupę tworzyło dziewięciu ochotników niemających dolegliwości bólowych. Jako wielkość statystyczną wykorzystano procentową zgodność wyników współczynnika „K” oraz przedziały współczynnika rzetelności wg Huijbregtsa [3]. Zgodność wyników uzyskiwanych przez różnych badających wyrażona jako średnia zgodność procentowa wynosiła 42% przy średniej wartości współczynnika rzetelności wynoszącej 0,052. Zgodność czynników uzyskanych przez jednego badającego mieściła się w przedziale 44–88% ze średnią wartością 68%. Współczynnik rzetelności był zawarty w przedziale 0,16–0,72, przy jej średniej wartości wynoszącej 0,46. Autorzy wyciągnęli wniosek, że trafność i rzetelność testu zgięcia tułowia w pozycji stojącej staje pod znakiem zapytania.

Podsumowanie

W artykule dokonano przeglądu wyników badań i danych z literatury poświęconych trafności i rzetelności pojedynczych ruchów testów palpacyjnych wraz z ich konkluzją dotyczącą implikacji klinicznych przydatnych w diagnostyce dysfunkcji stawu krzyżowo-biodrowego.
Aby znaleźć się w przeglądzie, każde z badań musiało spełnić określone kryteria. Akceptowano wyłącznie pełne publikacje opisujące randomizowane1 kontrolne próby kliniczne. Nie stosowano jakichkolwiek ograniczeń językowych. Uczestnika...

Pozostałe 70% treści dostępne jest tylko dla Prenumeratorów

Co zyskasz, kupując prenumeratę?
  • 10 wydań czasopisma "Praktyczna Fizjoterapia i Rehabilitacja"
  • Nielimitowany dostęp do całego archiwum czasopisma
  • ...i wiele więcej!
Sprawdź

Przypisy