Contenido de la revista

Cardiotocografía versus doppler
Auscultación de la frecuencia fetal
Ensayo clínico aleatorio que compara estas dos alternativas al inicio del trabajo de parto
en población obstétrica de bajo riesgo

Análisis de los posibles beneficios de la monitoría fetal sin estrés en mujeres de bajo riesgo obstétrico

Título: Randomized controlled trial of cardiotocography versus Doppler auscultation of fetal heart at admission in labour in low risk obstetric population.

Autores: Mires G, Williams F, Howie P.

Lugar: Departamento de Obstetricia y Ginecología y Departamento de Epidemiología y Salud Publica, Hospital Ninewells, Facultad de Medicina, Dundee, Reino Unido.

Revista: BMJ 2001; 322: 1457-62.

Objetivo: Comparar el efecto de la cardiotocografía (monitoría fetal sin estrés) y la auscultación de la frecuencia cardíaca con doppler en los desenlaces neonatales y los niveles de intervención obstétrica sobre las madres.
Materiales y métodos: Se escogieron mujeres programadas para tener un parto hospitalario que fueron evaluadas en el tercer trimestre, sin complicaciones obstétricas que indicaran el uso de monitoría intraparto (pre-eclampsia, hipertensión, diabetes, retardo del crecimiento intrauterino, abruptio placentae, placenta previa, sangrado vaginal de origen no establecido, embarazo múltiple, malformaciones fetales, cesárea previa, isoinmunización y presentación de nalgas).

Al momento del ingreso a la sala de trabajo de parto las mujeres se dividieron en dos grupos de forma aleatoria. Al primer grupo se le realizó un registro cardiotocográfico de 20 minutos; al segundo, medición de la frecuencia cardíaca fetal con doppler durante e inmediatamente después de una contracción. Según los resultados se definió la conducta obstétrica de acuerdo con un protocolo preestablecido. Al momento del parto se tomaron muestras del cordón para medición de pH y déficit de bases.

El desenlace principal fue la presencia de acidosis metabólica en el feto (pH < 7,2 con déficit de base >8 mmol/l). Otros desenlaces considerados en el estudio fueron el puntaje de Apgar en el recién nacido y necesidad de alguna o varias de las siguientes intervenciones: CPAP para el niño; ingreso a la UCI neonatal y materna; uso de monitoría intraparto; la ruptura artificial de las membranas; refuerzo del trabajo de parto; monitoría del pH fetal en cuero cabelludo; la analgesia epidural; y el parto por vía quirúrgica o instrumentada.
El tamaño de la muestra se calculó para poder encontrar una diferencia de 4% entre los grupos, con un poder de 80% y un error alfa de 0,05.

Resultados: Debido a que hubo mujeres en los dos grupos que presentaron complicaciones intraparto, se realizó un análisis en el grupo total y luego en el de aquellas mujeres sin complicaciones. En ninguno de los dos hubo diferencia significativa en la incidencia de acidosis metabólica fetal. Se encontró mayor frecuencia de monitoría intraparto, analgesia epidural, refuerzo del trabajo de parto y parto quirúrgico o instrumentado en el grupo asignado a cardiotocografía.
Además, de las mujeres asignadas a cardiotocografía, 21,5% fueron consideradas con hallazgos anormales al ingreso en comparación con 3,6% del grupo doppler. Las anomalías más frecuentes en el grupo de cardiotocografía fueron las desaceleraciones (58%) y la disminución de la variabilidad (43%), contra bradicardia y desaceleraciones en 43% de las mujeres del grupo de doppler.

Análisis crítico

Como siempre, antes de iniciar el análisis critico es preciso resaltar un concepto importante. Para este estudio en particular, un elemento nuevo consiste en los datos que se relatan al hablar del cálculo del tamaño de la muestra.

Se acepta en investigación que antes de realizar el estudio para cumplir con los supuestos estadísticos, es necesario proponer un par de hipótesis: la nula y la alterna. Estas proposiciones –la priasmera que generalmente afirma que no hay diferencias y la segunda, que sí las hay y en qué dirección operan– sirven para aplicar el método hipotético-deductivo sobre el que se sostiene el método científico actual. Este método dice que el investigador tiene que buscar “falser” las proposiciones que cree son ciertas, en contra de la “confirmación” de las mismas que utilizamos en la vida común. ¿Por qué? Porque es más fácil demostrar que una proposición es falsa con sólo encontrar una excepción a la regla, en vez de buscar infinidad de confirmaciones. Por ejemplo, cuando se afirma que no hay elefantes blancos porque nunca se han visto y porque además hay cientos de elefantes grises en el mundo, dicha proposición pierde veracidad con sólo encontrar un elefante blanco, la excepción a la regla. Entonces el investigador propone una hipótesis nula y trata de falserla con todos los métodos posibles. Si no puede hacerlo, entonces acepta la hipótesis alterna. En la medida en que esto se repite, la teoría inicial se va fortaleciendo.

Ahora bien, aunque no se pueda falser la hipótesis nula, siempre existirá un grado de incertidumbre sobre la verdad de este resultado. Este grado de incertidumbre es el que se determina con dos datos bastante corrientes en la literatura médica: el error alfa y el beta.

El error alfa se refiere a la posibilidad de decir que una conclusión de un estudio es verdadera cuando en realidad es falsa. Para este caso se ha acordado un valor de 5% como estándar para aceptar estadísticamente la tolerancia a este error. Esto quiere decir que con un error de 0,05, toleramos equivocarnos 1 de 20 veces al afirmar que una conclusión es verdadera cuando en realidad no lo es.
El error beta se refiere a la posibilidad de decir que una conclusión de un estudio es falsa cuando en realidad es verdadera. Para este caso se ha acordado un valor de 20%. Usualmente se utiliza un término, que es el valor complementario del error alfa, que se denomina el poder. Por eso cuando se dice poder, en realidad, se habla de error beta. ¿Y por qué este valor es mas alto? Porque en estudios clínicos es más tolerable dejar pasar algo que es cierto que aceptar algo que no lo es.

Volviendo al tamaño de la muestra, el número de sujetos que se necesita para un estudio se calcula teniendo en cuenta el error alfa (0,05 o menos), el poder (80% o más) y la diferencia que se considera es la mínima aceptable desde el punto de vista clínico. Para este estudio, los autores la fijaron en 4%. Esto quiere decir que si el número de recién nacidos en los grupos diferían en menos de 4%, esto equivaldría a decir que las dos terapias no son diferentes.

¿Son los resultados válidos?

¿Las pacientes fueron seleccionadas al azar?

Sí. Los autores refieren que durante la consulta del tercer trimestre solicitaron el consentimiento informado y las pacientes fueron seleccionadas en ese momento usando un programa de computador.

¿La asignación fue enmascarada?

Sí. Una vez seleccionadas, la asignación se hizo utilizando un sobre sellado que se puso en la historia clínica. Ni las mujeres ni los médicos tratantes supieron del grupo de asignación hasta el momento del ingreso a la sala de trabajo de parto, cuando se abrió el sobre.

¿Las pacientes fueron analizadas en el grupo al que fueron asignadas originalmente?

Sí. Los autores no sólo refieren haber utilizado la estrategia de análisis por intención de tratar, sino que además, debido a que algunas mujeres presentaron complicaciones intraparto y como la población original eran mujeres de bajo riesgo, hicieron un análisis del grupo total asignado y después del grupo de mujeres sin complicaciones. No hubo migración entre los grupos.

¿Las pacientes en los grupos de tratamiento y control fueron similares respecto a los factores pronósticos conocidos?

No se sabe. Desafortunadamente los autores no reportaron la llamada “tabla 1” de los ensayos clínicos, donde se muestran los datos pronósticos relevantes de las pacientes divididas según el grupo asignado. Esa tabla no solamente muestra que los grupos fueron iguales al inicio del tratamiento, sino también las características particulares del grupo de pacientes reclutadas. En este caso no se sabe si las mujeres eran maternas jóvenes o no, cuántas de ellas habían tenido un parto previo y cuántos partos, de qué raza eran. Estos datos pueden servir a la hora de extrapolar los resultados.

¿Las pacientes conocían a qué grupo fueron asignadas?

Sí. Una vez iniciaron su trabajo de parto, las mujeres asignadas a cardiotocografía inmediatamente supieron a qué grupo fueron asignadas, pues el examen no puede hacerse de manera ciega.

¿Los médicos tratantes conocían a que grupo fueron asignados las pacientes?

Sí. Igualmente, el médico conocía el resultado de la cardiotocografía y el doppler y basado en eso tomaba decisiones según el protocolo de la institución.

¿Los evaluadores de los desenlaces conocían a que grupo fueron asignados las pacientes?

Probablemente sí. Aunque en el texto no se encuentra explícito, es probable que los médicos tratantes conocieran el resultado del pH del cordón y de las demás variables de desenlace. Sin embargo, para el caso del pH, ésta es una medida suficientemente objetiva para ser inmune a la falta de ocultación por parte de los evaluadores. Las demás variables pueden estar sesgadas por esta razón. No obstante, los autores afirman que a los analistas de los datos se les encubrió a la asignación y que las decisiones se tomaron de acuerdo a un protocolo preestablecido que evita de alguna forma la variabilidad en el curso de acción, lo cual intenta equilibrar de alguna manera la debilidad del estudio abierto.

¿El seguimiento fue completo?

Aparentemente sí. Tampoco existe une afirmación específica sobre este aspecto, pero por el diseño del estudio y el tipo de desenlaces que se definen en muy corto tiempo y antes que la madre salga del hospital, es probable que haya sido completo.

Hasta este punto, existen algunas debilidades importantes como la falta de reporte de las características de las pacientes al inicio del estudio y la característica abierta (no ciega) de la evaluación de los desenlaces. Esta última puede haber incluido sesgos en aquellas variables que son mas subjetivas, pero es poco probable que afecten la variable de desenlace principal, por ser ésta altamente objetiva (pH).

¿Cuáles fueron los resultados?

¿Qué tan grande fue el efecto del tratamiento? y ¿qué tan preciso fue el estimado del efecto del tratamiento?

El índice de probabilidades para acidosis meabólica fetal fue de 0,96 (IC 95% 0,79-1,17) y 1,02 (IC 95% 0,79-1,31) para el grupo total y el grupo de mujeres sin complicaciones intraoperatorias, respectivamente. Esto indica que no hay diferencias en cuanto a la frecuencia de acidosis metabólica fetal.

El índice de probabilidades para el uso de monitoría intraparto fue de 1,49 (IC 95% 1,26-1,76), para uso de analgesia epidural fue de 1,33 (IC 95% 1,10-1,61), para el refuerzo del trabajo de parto fue de 1,26 (IC 95% 1,02-1,56) y para el parto quirúrgico o instrumentado fue de 1,36 (IC 95% 1,12-1,65), todos con diferencias significativas a favor del grupo de cardiotocografía. En las demás variables no hubo diferencias significativas.

Los resultados del estudio muestran que en la variable de desenlace más importante y objetiva, el valor del pH del cordón, no hubo diferencia estadísticamente significativa, lo que quiere decir que la cardiotocografía en comparación con la detección de la frecuencia cardíaca fetal con doppler no ofrece mayor beneficio sobre el feto. Las demás variables, que pueden estar sujetas a sesgo, indican que la cardiotocografía aumenta la frecuencia de maniobras obstétricas, en valores que pueden variar desde 2% a 76%. Esto puede indicar que el examen sólo induce a acciones que no ofrecen beneficio final sobre el pronóstico fetal.

¿Cómo puedo aplicar los resultados al cuidado de mis pacientes?

¿Las pacientes del estudio son similares a mis pacientes?

No sabemos. Debido a que no se reportaron las características basales de las mujeres es imposible decirlo con certeza. Sin embargo, no existen razones poderosas para pensar que sean excesivamente diferentes y hasta que no podamos definir alguna condición que las haga muy distintas, estas mujeres pueden ser similares a las que consultan localmente.

¿Se consideraron todos los desenlaces clínicos relevantes?

Sí. Se tuvieron en cuenta variables clínicas (Apgar) y paraclínicas (pH) de pronóstico fetal, lo mismo que maternas.

¿Los probables beneficios superan los daños potenciales y los costos?

Sí. Realizar un doppler es mucho más barato que la cardiotocografía, requiere de menos tecnología y el entrenamiento del personal para interpretar los resultados es mínimo.

Los resultados de este ensayo demuestran que el uso rutinario de la cardiotocografía (monitoría fetal sin estrés) en mujeres de bajo riesgo obstétrico no ofrece un beneficio en el pronóstico fetal y al contrario, aumenta los costos y la realización de intervenciones obstétricas que pueden ser peligrosas. Dicha conclusión está en concordancia con resultados de otros estudios que han evaluado el uso rutinario de exámenes paraclínicos en población normal, los cuales han demostrado que su utilidad es pobre. Además, que pueden desencadenar una cascada de intervenciones y estudios que sólo aumentan los costos y la angustia del paciente y no representan mayor ganancia clínica.