seminario   publicaciones   tutoriales

   

tutoriales

mapa del sitio   @

Tecnología World Wide Web

Bases de la tecnología World Wide Web

La tecnología del World Wide Web es un sistema de información el cual esta compuesto por agentes interconectados. Un agente es un programa que actúa a nombre de otra persona, entidad, o proceso con el fin de intercambiar información y presentar la información en un formato legible al usuario. Por ejemplo un navegador de paginas webs es un agente (Konqueror, Mozilla) utilizado por el usuario para accesar las paginas webs que se encuentran en los agentes servidores (Apache, Tomcat, etc). Para que los agentes puedan intercambiar información y presentar la información en un formato legible al usuario, los agentes deben satisfacer tres propiedades:

-. Representación.

-. Identificación.

-. Interacción.

Propiedad de representación

La propiedad de representación es utilizada para estructurar la información contenida en un documento Web. Esta propiedad utiliza una combinación de grafos en forma de árbol, grafos directos y objetos para estructurar la información. En un documento Web, los siguientes tipos de información pueden ser estructurados: Texto, imágenes y objetos. La información contenida en un documento Web es estructurada en forma de árbol donde cada nodo es considerado un objeto. Cada nodo puede estar compuesto por atributos, nodos hijos y contenido. Cada nodo es considerado una entidad. Una entidad un recurso que goza de identidad [3]. Por ejemplo un documento Web es un recurso, por lo tanto todos los nodos contenidos en el documento Web son recursos. Un recurso es nombrado e identificado por la propiedad de identificación. Una vez identificado un recurso, los agentes utilizan la propiedad de interacción para accesar, actualizar, eliminar o intercambiar recursos entre agentes.

El principal estándar internacional utilizado para representar la información de documentos electrónicos es el estándar ISO 8879. Este estándar es conocido con el nombre de Standard Generalized Mark Up Language (SGML) [5][6]. El SGML es un metalenguaje utilizado para definir, describir y normalizar documentos electrónicos basados en etiquetas. Una etiqueta es utilizada para dar: significado, estructura, nombre a un nodo, entidad y acción aplicada a la información etiquetada. La mayoría de las especificaciones de la tecnología World Wide Web son aplicaciones del SGML o derivan del SGML. Por ejemplo: El lenguaje extensible de etiquetas (Extensible Mark Up Language ) (XML) es el principal estándar para estructurar la información en la tecnología World Wide Web. Este estándar deriva del SGML. Las especificaciones XML permiten a los usuarios definir las etiquetas de un documento modelo el cual es utilizado para dar estructura y significado a la información de un documento. Un documento modelo se define con las especificaciones XML Schema o Document Type Definition [5][6][8][13]. Una vez definido un documento modelo se pueden crear múltiples documentos. De esta manera la información de un documento es estructurada y normalizada. Las especificaciones XML delega la función de formato o presentación de la información a las especificaciones XSL y CSS [11][15].

Propiedad de Identificación

La función de la propiedad de identificación es identificar, localizar y nombrar los recursos definidos por la propiedad de representación los cuales son almacenado en los repositorios de información de los agentes. Las especificaciones del RFC 2396 (URI) satisface la propiedad de identificación [3]. Un URI esta compuesto por tres definiciones:

-. Uniformidad.

-. Recurso.

-. Identificador.

La definición de Uniformidad establece el conjunto de reglas que definen las secuencias correctas de los elementos que conforman a un URI. Este conjunto de reglas proporciona un mecanismo común para interpretar los diferentes tipos de identificadores de recursos.

La definición de recurso es el mapeo conceptual a un nodo. Este mapeo es visto como un grafo directo entre dos nodos.

La definición de identificador es un objeto que actúa como referencia a algo que tiene identidad. Ejemplo un recurso.

La sintaxis genérica que representa a un URI es la siguiente:

<esquema>:<parte especifica del esquema >

Dicha sintaxis es utilizada para definir las aplicaciones de un URI. Entre estas aplicaciones se encuentran los localizadores de recursos (URL) y nombre de recursos (URN).

Un URL define a un subconjunto de URI que identifican los siguientes parámetros: nombre del recurso, Localidad del recurso y protocolo de acceso del recurso. En general la parte especifica del esquema de un URL es el siguiente:

<Esquema>://<usuario>:<password>@<host>:<puerto>/<ruta del recurso>

El parámetro <Esquema> identifica el protocolo de acceso del recurso. Los parámetros <usuario> y <password> son opcionales ya que la presencia de estos parámetros en un URL depende del protocolo de acceso del recurso. Por ejemplo el protocolo FTP permite el uso de estos dos parámetros. El parámetro <host> define el nombre de dominio completamente calificado del agente. [18]. El parámetro <puerto> identifica el número de puerto del agente. Y el parámetro <ruta del recurso> identifica el nombre del recurso.

En la figura 1.1 podemos apreciar el siguiente URL: http://www.debian.org..

Figura 1.1 Uniform Resource Locator URL)

Figura 1.1 Uniform Resource Locator (URL)

Este URL identifica los siguientes parámetros:

-. ¿Cómo se llama el recurso (En este caso el documento Web)?

Por defecto index.html

-. ¿Dónde se puede localizar este recurso?

En el directorio raíz incluido en el directorio virtual del servidor de páginas Web cuyo nombre de dominio es www.debian.org.

-. ¿Cómo puede ser accesado el recurso?

La página puede ser accesada con el protocolo HTTP.

Un URL puede ser absoluto o relativo. Un URL absoluto identifica explícitamente el nombre del recurso, donde se localiza el recurso, y cómo el recurso puede ser accesado. Una vez que un recurso halla sido accesado, se puede utilizar un URL relativo para identificar los recursos de un documento. Un URL relativo no identifica el mecanismo de acceso primario. Por ejemplo, el siguiente: URI index.html#2 se puede clasificar como un URL relativo ya que el recurso index.html fue identificado y accesado por un URL absoluto, y el recurso 2 incluido en el documento index.html es identificado por el siguiente fragmento URI: # 2.

Los nombres uniformes del recurso (URN) no identifican la ubicación física del recurso mas bien son utilizados como identificadores persistentes e independientes de recursos y están diseñados para hacer factible el mapeo de nombres de recursos. La sintaxis genérica de un URN se puede representar de la siguiente manera:

<URN> ::= "urn:" <NID> ":" <NSS>

Un URN utiliza la secuencia "urn:" para identificar el esquema donde el parámetro NID especifica la identificación del espacio de nombres, y <NSS> especifica la secuencia del espacio de nombres de recursos de un documento. Una de las ventajas al utilizar un URN es la capacidad para el programador de nombrar sus propios recursos con el fin de evitar colisiones que pueden ocurrir cuando muchos documentos XML van a ser combinados en uno [14].

Propiedad de Interacción

Una vez que un recurso es identificado por la propiedad de identificación, los agentes utilizan la propiedad de interacción para accesar, actualizar, eliminar o intercambiar recursos entre agentes vía protocolos. El principal protocolo implementado en los agentes en la tecnología del World Wide Web es el protocolo (HTTP) [4]. El protocolo http funciona a partir de solicitudes. Las solicitudes más comunes del protocolo http son:

-. GET. Es una solicitud para leer un recurso.Ejemplo una pagina Web.

-. PUT. Es una petición para almacenar un recurso.

-. DELETE. Indica una solicitud para remover un recurso.

-. POST. Es una petición que añade información a un recurso nombrado.

-. HEAD. Es una petición para leer la cabecera de un página Web.

Cada solicitud hecha por el navegador a través del protocolo http recibe una respuesta acompañada por un código de estado. El código de estado más común es el código 200 (OK), este código indica que el servidor respondió a la solicitud satisfactoriamente. Para conocer las solicitudes y respuestas del protocolo http ver las secciones 9 y 10 del RFC 2616.

Anterior  Inicio  Siguiente

© 2002 New Devices. Derechos Reservados.