top of page

Un recorrido a través de la proteómica basada en espectrometría de masas

César Joaquín  Huallpa Robles
c%C3%A9sar_edited.jpg

Estudiante de Biología

17 abril 2020

La espectrometría de masas, una técnica que apareció a inicios del siglo XX, nos brinda información de las masas de átomos y moléculas presentes en una muestra. Avances en el diseño de este instrumento a finales de los años ochenta permitieron su ingreso en el campo de la proteómica, el estudio del conjunto de proteínas de un organismo. Actualmente la espectrometría de masas juega un papel central en el análisis de muestras complejas de proteínas, al permitir descubrir, identificar y cuantificar las proteínas presentes. En este artículo se presenta una explicación general del funcionamiento de un espectrómetro de masas y del inicio de su relación con la proteómica, además de la revisión de algunas metodologías usadas.

Funcionamiento general de un espectrómetro de masas

Aunque existe una gran variedad de espectrómetros de masas, todos comparten una misma estructura basada en tres componentes: fuente de ionización, analizador de masas y detector, los cuales son operados bajo condiciones de vacío (Aebersold y Mann, 2003; Gross, 2017a). Como podemos ver en la figura 1-a, los analitos son inyectados en la fuente de ionización, donde se fragmentan, ionizan y transfieren a fase gaseosa. Los fragmentos ionizados son lanzados hacia el analizador, donde se separan en función a sus m/z (Gross, 2017a). El detector amplifica la señal de cada ion analizado y lo transduce para su interpretación mediante el uso de sistemas de datos (Gross, 2017a). El resultado es un espectro de masas, un gráfico que muestra la abundancia de los iones detectados versus la m/z normalizada al ion más abundante (pico base) en el espectro, cuya calidad depende de la resolución, sensibilidad y exactitud del analizador utilizado y de la complejidad de la muestra a analizar, como el número de analitos y la presencia de impurezas (Aebersold y Goodlett, 2001; Aebersold y Mann, 2003).

Los inicios de la proteómica

A mitad de los años noventa fue introducido el término proteoma para referirse al conjunto de proteínas expresado por el genoma de un organismo (Patterson y Aebersold, 2003; Zhang, Fonslow, Shan, Baek, y Yates, 2013). Sin embargo, la proteómica, el estudio del proteoma, nació allá por los años setenta (De Oliveira y De Graaff, 2011). Una forma de visualizar la complejidad del proteoma de una célula es utilizando la electroforesis bidimensional (2DE), una técnica que puede separar de cientos a miles de proteínas en un gel de poliacrilamida, basándose en los puntos isoeléctricos (la primera dimensión) y las masas (la segunda dimensión) de las proteínas (Gooley et al., 1997; Lodish et al., 2016; Rabilloud y Lelong, 2011). Luego, las proteínas son teñidas, viéndose como manchas en el gel, y cuantificadas, de acuerdo a la intensidad de tinción de cada mancha (Aebersold y Mann, 2003). Una vez separadas, las proteínas son secuenciadas por el método de Edman para su posterior identificación (Mann, 2016a). Finalmente, se depositan las secuencias obtenidas en bases de datos especializadas (Patterson y Aebersold, 2003).

1._edited.jpg

Figura 1: Componentes y funcionamiento de un espectrómetro de masas

En (a) se muestra un esquema general de los componentes de un espectrómetro de masas: 1) los analitos son ionizados y fragmentados en la fuente de ionización, luego 2) son separados en función a su m/z en el analizador, hasta llegar 3) al detector. 4) Un sistema de datos integra la información obtenida y produce un 5) espectro de masas. 6) Normalmente un espectrómetro usa sistema de vacío. En (b), un esquema de un espectrómetro de masas MALDI-TOF. En MALDI, los analitos se mezclan con la matriz, un ácido orgánico de bajo peso molecular que absorbe radiación UV, para co-cristalizar sobre una placa metálica. La energía del pulso disparado por un láser UV es absorbida por la matriz y luego transferida a los analitos, permitiendo simultáneamente su vaporización y ionización pulsátil. En el analizador TOF los iones se separan en función al tiempo de vuelo (y por ende velocidad) que demoran en recorrer la misma distancia dentro del tubo del TOF hasta llegar al detector. Un reflector corrige las diferencias en energía entre iones de la misma m/z que de otro lado llegarían en tiempos diferentes. Figura 1-a modificada de Gross (2017a), Figura 1-b modificada de Gross (2017b).

 

Identificando proteínas por secuenciamiento

De la misma manera como somos capaces de identificar la palabra completa en ESPEC…OM...ÍA (ESPECTROMETRÍA) usando nuestra memoria e inteligencia, podemos identificar proteínas sin tener que secuenciarlas completamente usando bases de datos de secuencias proteicas y algoritmos. Este secuenciamiento parcial era llevado a cabo también por el método de Edman que, aunque automatizado, era poco sensible y lento (Gooley et al., 1997; Patterson y Aebersold, 2003).

El ingreso de la espectrometría de masas al estudio de las proteínas

A finales de la década de los ochenta, la espectrometría de masas superó la gran limitante por la que aún no era aplicada en proteómica: la ionización y volatilización de grandes polímeros, como las proteínas, sin fragmentarlos (Patterson y Aebersold, 2003; Perry, 2015). Los responsables fueron John Fenn, por un lado, y Franz Hillenkamp, Michael Karas y Koichi Tanaka por el otro, quienes desarrollaron las dos fuentes de ionización más utilizadas en proteómica: ionización por electronebulización (ESI) y la desorción/ionización láser asistida por matriz (MALDI), respectivamente (Aebersold y Mann, 2003; Dellisanti, 2015; Hansell, 2015). Parafraseando a John Fenn, ganador del Premio Nobel en Química 2002 junto a Koichi Tanaka por tal hazaña, ¡hicieron volar a los elefantes moleculares, las proteínas! (Fenn, 2002).

Identificando proteínas por espectrometría de masas

Uno de los primeros espectrómetros de masas introducidos para el estudio de proteínas fue el MALDI-TOF (figura 1-b), capaz de determinar con gran exactitud, sensibilidad y resolución la masa de una proteína (Aebersold y Mann, 2003). Sin embargo, dicha masa no es una característica concluyente para su identificación (Patterson y Aebersold, 2003). Como ejemplo de ello, usaremos la notación de una letra de los aminoácidos para representar tres pequeños péptidos. Podemos notar que la masa del péptido ARTERIAS es la misma que la de los péptidos ESTIRARA y SERRATIA, ya que solo hemos cambiado el orden de la secuencia de aminoácidos (como curiosidad, Serratia es el nombre de un género de Bacteria).

Es entonces cuando Henzel et al. (1993) mostraron un método sencillo y rápido para la identificación de proteínas a partir de separaciones de 2D: el mapeo peptídico. En este método, conocido también como fingerprinting de masas peptídicas, las proteínas en estudio son digeridas enzimáticamente por proteasas que cortan en sitios específicos de la cadena polipeptídica, y los fragmentos producidos son analizados e identificados por MS. Por ejemplo, la tripsina, una serina proteasa, corta cadenas polipeptídicas en el extremo carboxilo de lisinas (K) y argininas (R) (Giansanti et al., 2016). Siguiendo nuestro ejemplo, se procederá con la digestión con tripsina de nu

2...JPG

*[M]: péptido sin ionizar

**[M+H]+: péptido ionizado por adición de un ion hidrógeno (z=1).

***[M+2H] ++: péptido ionizado por adición de dos iones hidrógeno (z=2).

Cálculo de las masas: https://web.expasy.org/peptide_mass/ (PeptideMass, s/f)

Tabla 1: Masas teóricas de los fragmentos obtenidos por la digestión enzimática completa con tripsina de los péptidos ARTERIAS, ESTIRARA y SERRATIA.

Como podemos observar, cada péptido produce un patrón de fragmentos diferente. Ahora nuestra muestra problema, en la que no sabemos cuál de los tres péptidos se encuentra, es introducida en el MALDI-TOF y se obtiene el espectro mostrado en la figura 2-a, donde podemos observar tres picos bien definidos que representan los fragmentos detectados por el instrumento. El último paso también es una comparación, pero no de secuencias, sino de masas experimentales y teóricas (figura 2-b). De esta manera podemos concluir que es el péptido SERRATIA el que se encontraba en nuestra muestra problema.

3.JPG

Fuente: Elaboración propia

Figura 2: (a) espectro de masas hipotético del péptido aún no identificado y (b) comparación de las masas experimentales con las teóricas del péptido SERRATIA. No todos los m/z teóricos aparecen en la lista de m/z experimentales debido a que estos m/z no han sido detectados. Lo contrario ocurre porque la digestión no ha sido totalmente eficiente (puedes corroborar que el m/z experimental 547.297 corresponde al péptido SERR, y el m/z experimental 903.500 al péptido SERRATIA, ambos en estado [M+H]+ ). Elaboración propia.

Identificando bacterias por espectrometría de masas

Hablando del género de bacterias Serratia, es posible identificar el género de una bacteria mediante MALDI-TOF (Krásný, Hynek, y Hochel, 2013). En la metodología más sencilla de identificación, los cultivos frescos de bacterias son colocados directamente en la fuente MALDI, donde terminan lisándose (Singhal, Kumar, Kanaujia, y Virdi, 2015). Las proteínas bacterianas (principalmente ribosomales) se liberan en el analizador TOF y aquellas más abundantes son detectadas, formando un espectro de masas único del microorganismo, a modo de una huella dactilar. El microorganismo es identificado al comparar su espectro con los de diferentes especies ubicados dentro de una base de datos (Santos, Hildenbrand, y Schug, 2016).

Secuenciamiento de péptidos por espectrometría de masas

Un año antes de la publicación del método de identificación por mapeo peptídico, Hunt et al. (1992) mostraron que era posible secuenciar péptidos en pequeñísimas cantidades, del orden de los femtomoles (femto- equivale a 10-15), a partir de mezclas peptídicas complejas, utilizando la cromatografía líquida acoplada a espectrometría de masas en tándem, o LCMS/MS (Mann, 2016b). La cromatografía líquida (LC), llevada a cabo en un cromatógrafo líquido de alta eficacia (HPLC), se da en fase reversa, lo que quiere decir que los péptidos se van a separar en fracciones de acuerdo a su hidrofobicidad (Gillet, Leitner, y Aebersold, 2016). Luego, las fracciones son inyectadas en el espectrómetro de masas en tándem (MS/MS), llamado así porque, en su versión más sencilla, posee dos analizadores consecutivos en vez de uno (Gross, 2017c). En un MS/MS, los péptidos son ionizados y separados de acuerdo a su m/z en el primer analizador, se fragmentan al salir de él en una cámara de colisión, y se secuencian con base en sus fragmentos detectados en el segundo analizador (Gross, 2017c). Debido a la enorme cantidad de péptidos producto de la digestión, generalmente solo algunos son seleccionados para estudios posteriores. Este último detalle es muy importante, como veremos más adelante.

¡Adiós 2DE-MS, hola LC-MS/MS!

El secuenciamiento de péptidos realizado por Hunt et al. (1992) dio luces para el análisis de proteínas presentes en mezclas complejas usando un instrumento LC-MS/MS: bastaría con agregar un paso previo de digestión para obtener fragmentos peptídicos de todas las proteínas de la mezcla, para encontrarnos donde Hunt comenzó su análisis de LC-MS/MS, con péptidos. Al final obtendremos las secuencias de estos fragmentos, con los que se identifican las proteínas de las que provienen. En resumen, las proteínas son primero digeridas, los péptidos resultantes son secuenciados por MS/MS como vimos en el anterior apartado, y con su secuencia se identifican las proteínas de las que provienen (figura 3). Este es el llamado enfoque proteómico de abajo hacia arriba, o bottom-up (Chait, 2006; Gillet et al., 2016).

¿De qué manera se realiza un experimento de proteómica bajo el enfoque de abajo hacia arriba?

Existen tres principales estrategias bajo este enfoque. La proteómica de descubrimiento (también conocida como shotgun), la proteómica dirigida, y la proteómica basada en la adquisición independiente de datos (DIA) (Aebersold y Mann, 2016). Las tres se diferencian en un punto clave del modo de uso del LC-MS/MS resaltado antes: la forma en que los péptidos detectados en el primer analizador son seleccionados para ser fragmentados y analizados en el segundo analizador.

La estrategia de descubrimiento busca identificar la mayor cantidad de proteínas en una muestra (Gillet et al., 2016). Para ello, cada vez que una fracción proveniente del LC es inyectada en el MS/MS, los péptidos cuyas señales son las más intensas en el espectro de masas del primer analizador, son seleccionados para la subsiguiente fragmentación, asumiendo que son los péptidos representativos de dicha fracción (Doerr, 2014). Como el MS/MS usa la información del primer espectro en la selección, a esta estrategia también se le conoce como proteómica basada en la adquisición dependiente de datos (DDA) (Domon y Aebersold, 2010). Su principal desventaja es que, al utilizar un método heurístico para la selección, está sesgada para elegir aquellos péptidos con la señal más fuerte. Por lo tanto, sigue siendo un desafío cuantificar de forma reproducible los péptidos menos abundantes y, por ende, cuantificar las proteínas de donde provienen (Doerr, 2014).

En la proteómica dirigida, el espectrómetro fragmenta solo a aquellos péptidos previamente seleccionados por el usuario por pertenecer a las proteínas de interés, las dianas del estudio (de ahí el nombre de proteómica dirigida) (Gillet et al., 2016). Debido a que se elimina el ruido causado por otros péptidos no de nuestro interés, es especialmente útil en la detección y cuantificación de proteínas de manera muy sensible y reproducible (Aebersold y Mann, 2016). A pesar de ser bastante poderosa, esta segunda estrategia no es adecuada para realizar estudios cuyo objetivo sea obtener una amplia cobertura del proteoma, como era el caso de la estrategia de descubrimiento (Doerr, 2014).

Nuestra tercera estrategia es la proteómica basada en la adquisición independiente de datos (DIA). En un análisis DIA, se seleccionan todos los péptidos dentro de un rango definido de m/z para ser fragmentados (Ludwig et al., 2018). El análisis se repite una y otra vez a medida que el espectrómetro completa el análisis de todos los m/z (Doerr, 2014). Esto da como resultado una cuantificación precisa de todos los péptidos sin limitarse o parcializarse a péptidos de interés predefinidos o con mayor abundancia (Doerr, 2014; Gillet et al., 2016). Es decir, combina la ventaja de las dos anteriores estrategias, pero a su vez es la más desafiante entre las tres, por la gran cantidad de información a analizar, superior a las obtenidas por las otras dos estrategias (Ludwig et al., 2018).

Para aclarar las diferencias entre las tres estrategias, veamos la siguiente analogía, adaptada de Ludwig (2016). Imaginemos que nos encontramos sobrevolando en una avioneta toda la ciudad de Lima. Si con cuaderno en mano anotamos la mayor cantidad de lugares resaltantes a nuestra vista, como los edificios más altos o los parques más resaltantes, estaremos usando una estrategia de descubrimiento. En cambio, si en vez tenemos a la mano una guía de la ciudad, tal vez nos interese solo distinguir el Palacio de gobierno, el Aeropuerto Internacional Jorge Chávez, o tal vez tu casa (si vives en Lima, claro), para lo que podrías usar binoculares, ya que tu búsqueda es dirigida. Esta es la estrategia dirigida de la proteómica. Por último, podemos tomar fotos a todos los puntos de la ciudad que hemos sobrevolado, y al regresar a nuestra casa, revisar foto por foto los detalles de Lima. Se puede apreciar en este último caso, el equivalente a la estrategia basada en DIA, que es la estrategia más tediosa de todas.

Estudiando al proteoma de abajo hacia arriba y de arriba hacia abajo

Además del enfoque proteómico de abajo hacia arriba, existe un segundo enfoque, el de arriba hacia abajo, o top-down, donde las proteínas son analizadas intactas, sin digerirlas (Aebersold y Mann, 2016; Chait, 2006). Aunque este último enfoque ofrece ventajas en el análisis de las modificaciones postraduccionales de las proteínas (figura 4) y en la estructura de los grandes complejos proteicos (Aebersold y Mann, 2016; Catherman et al., 2014), el enfoque de abajo hacia arriba ha sido el enfoque tradicionalmente elegido en la mayoría de estudios proteómicos debido a que, gracias a la fragmentación previa al análisis, el rango de masas a analizar de los fragmentos peptídicos es mucho menor al que si estudiáramos proteínas intactas (Smith y Kelleher, 2013) ¡Imagínate tener una balanza que pueda medir con gran exactitud y precisión la masa tanto de un pequeñísimo grano de arena como la de una camioneta 4x4!

4.JPG

Figura 3: Un LC-MS/MS usado para identificar proteínas dentro de una muestra biológica compleja. Imagen tomada de Lodish et al. (2016).

5.JPG

Figura 4:  En el enfoque tradicional de abajo hacia arriba, las proteínas intactas se digieren en péptidos antes de la introducción en el espectrómetro de masas, donde luego se detectan y fragmentan. En la espectrometría de masas de arriba hacia abajo, la proteína se ioniza directamente, lo que permite una mejor cobertura de secuencia y detección de las PTM. Tomado de Catherman et al. (2014)

El enfoque de arriba hacia abajo: proteómica estructural y de interacciones

In vivo, raramente las proteínas trabajan solas; más bien se asocian con otras proteínas para formar complejos proteicos (Aebersold y Mann, 2016). El estudio de estas interacciones es realizado ya hace bastante tiempo con técnicas como la transferencia de energía de resonancia fluorescente (FRET) y el ensayo de doble híbrido en levaduras (Y2H) (Bludau y Aebersold, 2020). Con la llegada de espectrómetros de masas de alta resolución, han surgido nuevos métodos de estudios de la interactómica de proteínas (Bludau y Aebersold, 2020). Por ejemplo, usando la espectrometría de masas nativa, se analizan complejos proteicos directamente en su estado nativo, es decir, su estado natural dentro de las células (Aebersold y Mann, 2016). Con esta técnica es posible determinar las proteínas y los cofactores que forman el complejo, su estequiometría, topología y estructura (Aebersold y Mann, 2016). Además, la espectrometría de masas nativa puede ser usada complementariamente con otras técnicas de análisis estructural, tales como la cristalografía de rayos X, la resonancia magnética nuclear (NMR) y la microscopía crioelectrónica (Cryo-EM) para resolver la Ionización Separación Digestión Disociación en fase gaseosa Disociación en fase gaseosa Ionización Extremo N-terminal Extremo C-terminal Proteína intacta Iones peptídicos en fase gaseosa Fragmentos peptídicos ionizados Iones proteicos en fase gaseosa Fragmentos proteicos ionizados estructura de los complejos proteicos. Este enfoque actual de la proteómica estructural es llamado análisis estructural integrativo (Aebersold y Mann, 2016).

Conclusiones

Los nuevos avances en espectrometría de masas han sido más que beneficiosos para la proteómica, pues le ha brindado nuevas maneras de identificar, cuantificar, secuenciar, detectar modificaciones y analizar estructuralmente al proteoma de un organismo. Si bien es cierto podemos hablar de que la espectrometría de masas ha llegado a un nivel de madurez como técnica analítica, aún existen diversos obstáculos que debe sobrepasar, muchos de ellos relacionados al procesamiento de la enorme cantidad de información que produce. Nuevas conexiones con el resto de ómicas, como la genómica, transcriptómica y metabolómica, prometen mejorar aún más nuestro entendimiento del funcionamiento de los seres vivos en el contexto de la biología de sistemas.

Referencias

bottom of page