Mensajes HTTP
Los mensajes HTTP, son los medios por los cuales se intercambian datos entre servidores y clientes. Hay dos tipos de mensajes: peticiones, enviadas por el cliente al servidor, para pedir el inicio de una acción; y respuestas, que son la respuesta del servidor.
Los mensajes HTTP están compuestos de texto, codificado en ASCII, y pueden comprender múltiples líneas. En HTTP/1.1, y versiones previas del protocolo, estos mensajes eran enviados de forma abierta a través de la conexión. En HTTP/2.0 los mensajes, que anteriormente eran legibles directamente, se conforman mediante tramas binarias codificadas para aumentar la optimización y rendimiento de la transmisión.
Los desarrolladores de páginas Web, o administradores de sitios Web, desarrolladores... raramente codifican directamente estos mensajes HTTP. Normalmente especifican estos mensajes HTTP, mediante archivos de configuración (para proxies, y servidores), APIs (para navegadores) y otros medios.
El mecanismo de tramas binarias de HTTP/2 ha sido diseñado para que no necesite ninguna modificación de las APIs o archivos de configuración utilizados: es totalmente transparente para el usuario.
Las peticiones y respuestas HTTP, comparten una estructura similar, compuesta de:
- Una línea de inicio ('start-line' en inglés) describiendo la petición a ser implementada, o su estado, sea de éxito o fracaso. Esta línea de comienzo, es siempre una única línea.
- Un grupo opcional de cabeceras HTTP, indicando la petición o describiendo el cuerpo ('body' en inglés) que se incluye en el mensaje.
- Una línea vacía ('empty-line' en inglés) indicando toda la meta-información ha sido enviada.
- Un campo de cuerpo de mensaje opcional ('body' en inglés) que lleva los datos asociados con la petición (como contenido de un formulario HTML), o los archivos o documentos asociados a una respuesta (como una página HTML, o un archivo de audio, vídeo ... ) . La presencia del cuerpo y su tamaño es indicada en la línea de inicio y las cabeceras HTTP.
La línea de inicio y las cabeceras HTTP, del mensaje, son conocidas como la cabeza de la peticiones, mientras que su contenido en datos se conoce como el cuerpo del mensaje.
Peticiones HTTP
Línea de inicio
Las peticiones HTTP son mensajes enviados por un cliente, para iniciar una acción en el servidor. Su línea de inicio está formada por tres elementos:
-
Un método HTTP, un verbo como:
GET
,PUT
oPOST
) o un nombre como:HEAD
oOPTIONS
), que describan la acción que se pide sea realizada. Por ejemplo,GET
indica que un archivo ha de ser enviado hacia el cliente, oPOST
indica que hay datos que van a ser enviados hacia el servidor (creando o modificando un recurso, o generando un documento temporal para ser enviado). -
El objetivo de una petición, normalmente es una URL, o la dirección completa del protocolo, puerto y dominio también suelen ser especificados por el contexto de la petición. El formato del objetivo de la petición varia según los distintos métodos HTTP. Puede ser:
-
Una dirección absoluta, seguida de un signo de cierre de interrogación
'?'
y un texto de consulta. Este es el formato más comun, conocido como el formato original ('origin form' en inglés), se usa en los métodosGET
,POST
,HEAD
, yOPTIONS
.POST / HTTP 1.1 GET /background.png HTTP/1.0 HEAD /test.html?query=alibaba HTTP/1.1 OPTIONS /anypage.html HTTP/1.0
-
Una URL completa; conocido como el formato absoluto, usado mayormente con
GET
cuando se conecta a un proxy.GET http://developer.mozilla.org/es/docs/Web/HTTP/Messages HTTP/1.1
-
El componente de autoriade de una URL, formado por el nombre del domínio y opcionalmente el puerto (el puerto precedido por el simbolo
':'
), se denomina a este formato como el formato de autoridad. Unicamente se usa conCONNECT
cuando se establece un tunel HTTP.CONNECT developer.mozilla.org:80 HTTP/1.1
-
El formato de asterisco, se utliza un asterisco (
'*'
) junto con las opciones:OPTIONS
, representando al servidor entero en conjunto.OPTIONS * HTTP/1.1
-
Una dirección absoluta, seguida de un signo de cierre de interrogación
-
la versión de HTTP, la cual define la estructura de los mensajes, actuando como indicador, de la versión que espera que se use para la respuesta.
Cabeceras
Las cabeceras HTTP de una petición siguen la misma estructura que la de una cabecera HTTP. Una cadena de caracteres, que no diferencia mayusculas ni minusculas, seguida por dos puntos (':'
) y un valor cuya estructura depende de la cabecera. La cabecera completa, incluido el valor, ha de ser formada en una única línea, y pude ser bastante larga.
Hay bastantes cabeceras posibles. Estas se pueden clasificar en varios grupos:
- Cabeceras generales, ('General headers' en inglés), como
Via
, afectan al mensaje como una unidad completa. - Cabeceras de petición, ('Request headers' en inglés), como
User-Agent
,Accept-Type
, modifican la petición especificándola en mayor detalle ( como:Accept-Language
, o dándole un contexto, como:Referer
, o restringiéndola condicionalmente, como:If-None
. - Cabeceras de entidad, ('Entity headers' en ingles), como
Content-Length
las cuales se aplican al cuerpo de la petición. Por supuesto, esta cabecera no necesita ser transmitida si el mensaje no tiene cuerpo ('body' en inglés).
Cuerpo
La parte final de la petición el el cuerpo. No todas las peticiones llevan uno: las peticiones que reclaman datos, como GET
, HEAD
, DELETE
, o OPTIONS
, normalmente, no necesitan ningún cuerpo. Algunas peticiones pueden mandar peticiones al servidor con el fin de actualizarlo: como es el caso con la petición POST
(que contiene datos de un formulario HTML).
Los cuerpos pueden ser dividos en dos categorias:
- Cuerpos con un único dato, que consisten en un único archivo defindo por las dos cabeceras:
Content-Type
yContent-Length
. - Cuerpos con múltiples datos, que están formados por distintos contenidos, normalmente estan asociados con los formularios HTML.
Respuestas HTTP
Línea de estado
La línea de inicio de una respuesta HTTP, se llama la línea de estado, y contienen la siguiente información:
- La versión del protocolo, normalmente
HTTP/1.1
. - Un código de estado, indicando el éxito o fracaso de la petición. Códigos de estado muy comunes son:
200
,404
, o302
- Un texto de estado, que es una breve descripción, en texto, a modo informativo, de lo que significa el código de estado, con el fin de que una persona pueda interpretar el mensaje HTTP.
Una línea de estado típica es por ejemplo: HTTP/1.1 404 Not Found.
Cabeceras
Las cabeceras HTTP para respuestas siguen también la misma estructura como cualquier otra cabecera: una cadena de texto, que no diferencia entre mayusculas y minúsculas, seguida por dos puntos (':'
) y un valor cuya estructura depende del tipo de cabecera. Toda la cabecera incluido su valor, se ha de expresar en una única línea.
Existen varias cabeceras posibles. Estas se puede dividir en distintos grupos:
- Cabeceras generales, ('General headers' en inglés), como
Via
, afectan al mensaje completo. - Cabeceras de petición, ('Request headers' en inglés), como
Vary
,Accept-Ranges
, dan información adicional sobre el servidor, que no tiene espacio en la línea de estado. - Cabeceras de entidad, ('Entity headers' en ingles), como
Content-Length
las cuales se aplican al cuerpo de la petición. Por supuesto, esta cabecera no necesita ser transmitida si el mensaje no tiene cuerpo ('body' en inglés).
Cuerpo
La última parte del mensaje de respuesta el es 'cuerpo'. No todas las respuestas tienen uno, respuestas con un código de estado como 201
o 204
normalmente prescinden de él.
De forma general, los cuerpos se pueden diferenciar en tres categorias:
- Cuerpos con un único dato, consisten en un simple archivo, de longitud conocida y definido en las cabeceras:
Content-Type
yContent-Length
. - Cuerpos con un único dato, consisten en un simple archivo, de longitud desconocida, y codificado en partes, indicadas con
Transfer-Encoding
valorchunked
(que significa: 'partido' en inglés). - Cuerpos con múltiples datos, consisten de varios datos, cada uno con una sección distinta de información. Este caso es relativamente raro y poco común.
Tramas HTTP/2
Los mensajes HTTP/1.x tienen algunas desventajas por su no muy alta eficiencia en la transmisión.
- Las cabeceras, al contrario de los cuerpos, no se comprimen.
- Las cabeceras, habitualmente se repiten de un mensaje al siguiente, aún así, la cabecera se repite en todos los mensajes.
- No se puede multiplexar. Se han de abrir varias conexiones para el mismo servidor, las conexiones TCP 'en caliente' ('warm TCP connections' en inglés) son más eficientes que las conexiones 'en frio'.
HTTP/2 introduce un paso extra: divide los mensajes HTTP/1.x en tramas que integra en un flujo de datos. Los datos y las tramas de las cabeceras, se separan, esto permite la compresión de las cabeceras. Varios flujos de datos pueden combinarse juntos, y entonces se puede usar un procedimiento de multiplexación, permitiendo un uso más eficiente, de las conexiónes TCP.
Las tramas HTTP son trasnparentes para los desarrolladores Web. Este paso adicional en HTTP/2, de los mensajes HTTP/1.0 y el protocolo por debajo. No son necesarios cambios en las APIs usadas por los desarrolladores Web para utilizar estas tramas HTTP, cuando las usan ambos: servidor y navegador.
Conclusión
Los mensajes HTTP son la clave para usar HTTP; su estructura es sencilla y son fácilmente ampliables. El protocolo HTTP/2 añade un mecanismo de tramas y una capa intermedia entre la sintaxis de HTTP/1.x y su protocolo inferior, sin modificarlo radicalmente: se construye sobre mecanismos de transmisión probados.