REDES- Revista hispana para el análisis de redes sociales
Vol.11,#9, Diciembre 2006
http://revista-redes.rediris.es

La vida social de los routers. Aplicando el conocimiento de las redes humanas al diseño de las redes de ordenadores [1]

Valdis Krebs[2] - Orgnet

Resumen

El diseño de redes de ordenadores debe tener en cuenta cómo están interconectados los routers[3] y los circuitos en un sistema global, conformando una estructura resistente. El análisis de redes sociales puede aplicarse en el diseño de las redes de ordenadores. Concretamente, en este artículo se utilizan los indicadores de centralidad para analizar la eficiencia y la resistencia de las redes de ordenadores.

Palabras clave: Redes de ordenadores – Redes humanas – Centralidad –  Eficiencia – Resistencia.

Abstract

Network design must carefully consider how routers and circuits are interconnected to form an overall system with as few single points of failure as possible. Social network analysis can be applied to the design of computer networks. In this paper the centrality measures are used to analyse the efficiency and the resiliency of computer networks.

Key words: Computer networks – Human networks – Centrality – Eficiencia – Resiliency.

Con frecuencia olvidamos que las redes de ordenadores se instalan para  hacer de soporte a las redes humanas –es decir, a los intercambios persona-a-persona de información, conocimiento, ideas, intuiciones y consejos. Este artículo recurre a la tecnología que fue desarrollada para medir y hacer mapas de redes humanas –el análisis de redes sociales- y aplica algunos de sus principios y algoritmos en el diseño de redes de ordenadores. Cuando vemos cada vez más modelos peer-to-peer (P2P) de redes de ordenadores, la métrica P2P resulta cada vez más aplicable al análisis de redes humanas[4].

Los analistas de redes sociales ven los sistemas humanos complejos como un sistema interconectado de nodos (personas y grupos) y lazos (relaciones y flujos) –igual que las inter-redes de routers y enlaces. Las redes humanas son con frecuencia sistemas emergentes, no planificados. Su crecimiento es esporádico y auto-organizado (Krebs, 1996). Los lazos de las redes se distribuyen irregularmente, con una alta densidad de lazos en algunas áreas de la red, mientras que otras están escasamente conectadas. Se les denomina “redes de mundo pequeño” (Watts & Strogatz, 1998). Las redes de ordenadores tienen con frecuencia unos patrones de conexión similares –una densa interconectividad entre subredes, con conexiones más escasas que unen las subredes en una inter-red más amplia.

Los consultores e investigadores se centran en los geodésicos –los caminos más cortos en la red. Muchos de los algoritmos de redes sociales actuales se basan en una rama de las matemáticas denomina teoría de grafos. Los científicos de redes sociales han centrado su trabajo, y en consecuencia sus algoritmos, en las siguientes áreas:

Uno de los métodos utilizados para comprender las redes y sus participantes es evaluar la localización de los actores en una red. Medir la localización de una red es encontrar la centralidad de un nodo (Freeman, 1979). Todas las medidas de redes que discutimos aquí se basan en geodésicos –el camino más corto entre dos nodos cualesquiera. Veamos una red social denominada “red cometa”, que muestra de un modo efectivo la diferencia entre los tres indicadores de centralidad más populares –el ABC- actividad (Activity), intermediación (Betweenness) y cercanía (Closeness). Este modelo fue desarrollado por David Krackhardt (1990), un líder en los estudios de redes sociales.

Actividad

La Figura 1 muestra una red social simple. Un lazo entre un par de nodos representa un flujo bidireccional de información, o el intercambio de conocimiento entre dos individuos. Los investigadores de redes sociales miden la actividad de un nodo utilizando el concepto de grado (degree) –el número de conexiones directas que tiene un nodo.

En esta red humana, Diane tiene el mayor número de conexiones directas, lo que la convierte en el nodo más activo en la red con la puntuación de grado más alta. El sentido común dicta que en las redes personales “mientras más conexiones, mejor”. Pero este no es siempre el caso. Lo que realmente importa es a donde conducen dichas conexiones -¡y cómo conectan a los que de otro modo estarían desconectados! (Burt, 1992). En este caso Diana sólo tiene conexiones con otros de su cluster más inmediato. Ella sólo conecta a aquellos que ya están conectados entre sí -¿tiene demasiados vínculos redundantes?


Figura 1. Red humana

Intermediación (Betweenness)

Mientras que Diane tiene muchos vínculos directos, Heather tiene pocas conexiones directas –estando por debajo del promedio en la red. No obstante, en cierto sentido, ella tiene una de las mejores ubicaciones en la red –es una puerta fronteriza y ejerce el rol de broker. Está entre dos componentes importantes, con un papel similar al de un router de frontera. La buena noticia es que juega un papel importante en la red, la mala noticia es que se trata de un punto de quiebra. Sin ella, Ike y Jane se separarían de la información y el conocimiento del cluster de Diane.

Cercanía (Closeness)

Fernando y Garth tienen menos conexiones que Diane. Sin embargo, el patrón de sus lazos les permite acceder a todos los nodos en la red más rápidamente que ningún otro. Tienen el camino más corto hacia todos los demás –están cerca de todos y cada uno. Aumentar la cercanía entre todos los routers mejora la actualización y reduce la cantidad de saltos. No obstante, aumentar la cercanía de sólo uno o de unos pocos routers ocasiona resultados contraproducentes, como veremos más adelante.

Sus posiciones demuestran que cuando se trata de conexiones en una red, la calidad es mejor que la cantidad. Situación, situación, situación –la regla de oro de la inmobiliaria también funciona en las redes. Cuando hablamos de vivienda es la geografía –tu barrio físico. En las redes, se trata de tu ubicación virtual determinada por tus conexiones –tu vecindario relacional.

Centralización de la red

La centralidad de los individuos en una red da una idea de la ubicación de los individuos en la red. La relación entre las centralidades de todos los nodos puede revelar mucho sobre la estructura global de la red. Una red muy centralizada es aquella que está dominada por uno o varios nodos muy centrales. Si estos nodos son dañados o eliminados, la red se fragmenta rápidamente en subredes desconectadas. Los nodos altamente centrales pueden convertirse en puntos críticos de fallo de un sistema. Una red con una baja centralización no está dominada por uno o varios nodos –y dicha red no tiene puntos únicos de fallo. Es resistente en presencia de muchos fallos locales. Muchos nodos o enlaces pueden fallar, a la vez que permite que los nodos restantes sean alcanzados a través de nuevos caminos.

Longitud de camino promedio en una red

Mientras más corto es el camino, menos saltos o pasos son necesarios para ir de un nodo a otro. En las redes humanas, los caminos más cortos implican una comunicación más rápida con menos distorsión. En las redes de ordenadores, la degradación y la demora de la señal no son un problema. No obstante, una red con muchos caminos cortos conectando a todos los nodos será más eficiente en la transmisión de datos y en la re-configuración después de un cambio topológico.

La longitud de camino promedio correlaciona fuertemente con la Cercanía de la red. Cuando la cercanía de todos los nodos entre sí mejora (cercanía promedio), la longitud del camino promedio en la red también mejora.

Topología inter-red

En un libro reciente sobre diseño de redes, Advanced IP Network Design (Retana, Slice & White, 1999), los autores definen una topología bien diseñada como la base de una red estable y de buen comportamiento. Además proponen que “tres metas que compiten entre sí deben ser equilibradas para el buen diseño de una red”:

En las siguientes páginas examinamos varias topologías de redes y las evaluamos utilizando indicadores de redes sociales, mientras recordamos estas tres metas competitivas en el diseño de redes.

Los modelos que examinamos no incluyen a las estructuras jerárquicas –con controladores del Núcleo, la Distribución y el Acceso- que se encuentran en las redes de cientos o miles de routers. Examinamos topologías planas, no jerárquicas, tales como las que se encuentran en las inter-redes más pequeñas, las subredes de área, o en backbones[5] centrales. Las topologías que modelamos son las más comúnmente utilizadas –la de estrella, la de anillo, la de malla completa y la de malla parcial. Calculamos las medidas de redes sociales en cada una de estas tipologías, y discutimos cómo los diferentes indicadores nos ayudan a conseguir las metas competitivas señaladas más arriba.

Topología de estrella

La topología de estrella, mostrada en la Figura 2, tiene muchas ventajas –pero un defecto deslumbrante. Las ventajas incluyen la facilidad de gestión y de configuración para los administradores de la red. Para la estrella, las tres metas competitivas quedan del siguiente modo:

El router A no es sólo un punto crítico de fallo, sino que es también potencialmente un cuello de botella. Muy probablemente se sobrecargará con el flujo de paquetes y las actualizaciones de enrutamiento a medida que se añadan más routers en la estructura de estrella. El router A obtiene la puntuación más alta en Actividad, Intermediación y Centralidad (1.000). Como resultado, la red está muy centralizada en torno al router A desde la perspectiva de los tres indicadores.

 

Figura 2. Routers en una tipología de estrella

Leyenda: Medidas de redes. 14 Caminos de longitud 1 + 42 caminos de longitud 2 = 56 geódesios en la red. Enlaces físicos: 7; Longitud de camino promedio: 1,750; Camino más largo: 2 saltos; Centralización de la red: 1.00 (máximo).

Topología de anillo

La topología de anillo, mostrada en la Figura 3, es una mejora sobre la estrella. Tiene algunas de las mismas ventajas, pero no elimina todos los inconvenientes de la estrella. Las ventajas incluyen la facilitad de gestión y de configuración para los administradores de la red –puesto que añadir otro router es muy simple. A diferencia de la topología de estrella, el anillo proporciona cierta redundancia y, por tanto, elimina el punto crítico de fallo: todos los nodos tienen un camino alternativo a través del cual pueden ser alcanzados. No obstante, todavía es vulnerable tanto a los fallos de los enlaces como a los de los routers. Para el anillo, las tres metas competitivas quedan como sigue:

La mayoría de las tecnologías modernas de anillo, tales como la red óptica sincrónica (Synchronous Optical Network, SONET) o el protocolo de transporte de paquetes dinámico de Cisco (Cisco Dynamic Packet Transport Protocol, DPT), añaden una medida de redundancia poniendo en funcionamiento un anillo doble que se repara a sí mismo si se corta un enlace. La red se “cierra” para evitar la línea que se ha caído y opera a una menor velocidad. Un camino de dos saltos puede convertirse en un camino de seis saltos con que sólo falle un enlace. Esto puede originar la congestión de la red si el anillo doble original estuviese siendo utilizado para datos en todas las direcciones.



Figura 3. Routers en una topología de anillo

Leyenda: Medidas de redes. 16 Caminos de longitud 1 + 16 caminos de longitud 2 + 16 caminos de longitud 3 + 16 caminos de longitud 4 = 64 geódesios en la red. Enlaces físicos: 8; Longitud de camino promedio: 2,500; Camino más largo: 4 saltos; Centralización de la red: 0.000 (mínimo).

Topología de malla completa

La topología de malla completa tiene varias grandes ventajas y varios defectos. Las ventajas incluyen una longitud de camino corta (un salto) hacia todos los demás routers, y máxima resistencia al fallo si los enlaces o los routers empiezan a fallar. Las desventajas giran en torno a la complejidad creada por esta tipología. Para la malla completa, las tres metas competitivas quedan como sigue:

Todas las desventajas de la topología de malla completa se centran en un defecto deslumbrante: hay demasiados enlaces físicos. Si los routers están muy lejanos, los costes de los enlaces pueden convertirse rápidamente en prohibitivamente caros puesto que añadir routers crea una explosión geométrica en el número de enlaces que se requieren. Pronto los routers no tienen suficientes puertos para soportar esta tipología. La administración del sistema y mantener un mapa actualizado de la topología se hace cada vez más complejo, a medida que se añaden nuevos routers. La red de la Figura 4 tiene 28 enlaces de doble sentido. Si se duplican los routers, en una topología de malla completa, el número de enlaces aumenta en un factor mayor de 4.

Figura 4. Routers en una topología de malla completa

Leyenda: Medidas de redes. 56 Caminos de longitud 1 = 56 geódesios en la red. Enlaces físicos: 28; Longitud de camino promedio: 1,000; Camino más largo: 1 salto; Centralización de la red: 0.000 (mínimo).

Topología de malla parcial

La topología de malla parcial es bastante diferente. Es la más difícil de construir. No hay una regla simple a seguir, a diferencia de los casos anteriores (regla para la estrella: conecta a todos al router A; regla para la malla completa: conecta todos con todos). Si se construye incorrectamente, la disposición de malla parcial puede tener muchas de las desventajas de las topologías anteriores sin tener muchos de sus beneficios. Si se construye correctamente, la verdad es la contraria: más ventajas y menos desventajas.

Construir una topología de malla parcial exitosa es donde realmente entra en juego el uso interactivo de nuestros indicadores de redes sociales. El diseño de más abajo surgió después de varias iteraciones. Con cada iteración la longitud del camino promedio fue cayendo hasta que pareció alcanzar un umbral donde ningún otro cambio disminuía el número de saltos sin aumentar significativamente el número de enlaces físicos necesarios. Para la malla parcial, las tres metas competitivas quedan como sigue:

La topología de la Figura 5 fue construida tomando como punto de partida una topología de anillo –una arquitectura simple. Se añadió un enlace y volvimos a medir la red. ¿Era esta estructura mejor que la anterior? En caso de ser así, se mantenía la estructura actual y se añadía un nuevo enlace para volver a medir la red. Este proceso iterativo se mantuvo hasta que no se consiguieron posteriores mejoras después de varios cambios. El proceso no garantiza una solución óptima, pero rápidamente consigue una buena solución: incluso redes amplias mejoran rápidamente con el añadido de unos pocos enlaces.


Figura 5. Routers en una topología de malla parcial

Leyenda: Medidas de redes. 24 Caminos de longitud 1 + 48 caminos de longitud 2 = 72 geódesios en la red. Enlaces físicos: 12; Longitud de camino promedio: 1,667; Camino más largo: 2 saltos; Centralización de la red: 0.000 (mínimo).

Una rareza de las redes es que a veces puedes restar sumando: añades un enlace a una red y se reduce la longitud del camino promedio. Lo contrario también ocurre a veces. Puedes sumar restando: eliminas un lazo y se observa el crecimiento del número de saltos promedio. En cualquier caso, nunca se tiene la certidumbre de qué efecto tendrá el añadido o la eliminación de un lazo. Nunca es un fenómeno lineal ni local. El tamaño y la dirección de estos cambios dependen de la topología previa de la red y de la ubicación del lazo que se elimina o se añade. Es clave disponer de un modelo que permita rápidos cálculos del tipo “qué pasa si…”.

Experimentemos con la eliminación de lazos de modo aleatorio (una situación similar al fallo de enlaces entre routers). Si eliminamos el enlace entre el router A y el router H en la Figura 5, el número de geodésicos en la red aumenta de 72 a 76, y la longitud de camino promedio aumenta hasta 1.815. Sin embargo, eliminando un lazo diferente, el que hay entre G y F, se reduce el número de geodésicos en la red de 72 a 66, mientras que la longitud del camino promedio aumenta sólo hasta 1.727. Si estamos preocupados sobre la existencia de demasiados caminos en la red, podemos eliminar otro lazo, el que hay entre B y C. Esto disminuye aún más el número de caminos más cortos hasta 60, mientras que reduce el número de enlaces físicos hasta 10. Esto está muy cerca de los 56 caminos en la muy eficiente topología de estrella. Pero mientras que la estrella es muy vulnerable debido a su punto crítico de fallo, esta malla parcial, con la eliminación de dos enlaces, es todavía robusta. Mientras que el número de geodésicos cae, la longitud de camino promedio asciende suavemente hasta 1.80 con la eliminación del segundo enlace. La Figura 5 no tiene caminos mayores de dos saltos. Con la eliminación de los dos enlaces (de G a F, y de B a C), ahora disponemos de 8 geodésicos de tres saltos, mientras que al mismo tiempo hay 12 geodésicos menos que cargar en las tablas de enrutamiento y dos enlaces físicos menos. Es un equilibrio constante.

Backbone de NSFNET

La red del Backbone de NSFNET, mostrada en la Figura 6, conectó a los centros de super-computación en Estados Unidos en 1989. Es un diseño de malla parcial que funciona como un ejemplo de la vida real con el que probar nuestros algoritmos de redes sociales.

Figura 6. NSFnet en 1989

Recordemos nuestras tres metas competitivas para un buen diseño de inter-redes.

¿Qué pasa con estas metas cuando experimentamos fallos en los enlaces o en los nodos de la red? La Tabla 1 muestra la métrica base para la Figura 6, y a continuación muestra qué ocurre con las métricas, y con nuestras tres metas, cuando tienen lugar cinco fallos diferentes.

Escenario

Número de geodésicos en la red

Centralización de la red

Caminos más largos (saltos)

Longitud de camino promedio (saltos)

Diseño original (Figura 6)

200

0.062

4

2.370

1) Fallo del nodo:
NCSA

180

0.208

5

2.689

2) Fallo del nodo:
MID

180

0.083

4

2.489

3) Fallo del nodo:
JVNC

148

0.046

4

2.324

4) Fallo del enlace:
NCSA-PSC

230

0.167

6

2.974

5) Fallo del enlace:
USAN-MID

212

0.123

5

2.660

6) Fallo del enlace:
MERIT-JVNC

192

0.069

4

2.458

Tabla 1. Posibles fallos de enlaces y de nodos.

El más dañino fue el fallo del enlace 4, el fallo del lazo entre el NCSA y el PSC. Este enlace corresponde a dos de los nodos más centrales en la red. Si el flujo entre nodos se distribuye de un modo irregular, este enlace es uno de los más transitados en la red.

El menos perjudicial fue el fallo del nodo 3, el JVNC. De hecho, ¡este fallo mejora la mayoría de las métricas! Al eliminar este nodo de la red, el número de caminos de la red disminuye significativamente, la centralización de la red disminuye, la longitud del camino se reduce ligeramente, y el camino más largo es todavía de cuatro saltos.

El diseño de la topología original de la NSFnet es muy eficiente. Intenté dos estrategias diferentes para mejorar la red. La primera estrategia consistió en mover enlaces ya existentes para conectar a diferentes parejas de routers. Pero no encontramos ninguna topología claramente mejor reordenando los enlaces entre routers. No pude encontrar un diseño mejor que redujese tanto el número de geodésicos como la longitud del camino, sin aumentar significativamente al mismo tiempo el número de enlaces físicos en la red.

La segunda estrategia es contra-intuitiva, pese a que con frecuencia las redes responden bien a este enfoque. Es la aproximación de “restar sumando” que describimos más arriba. Añadiendo nuevos enlaces en el lugar apropiado en la red, podemos no sólo reducir la distancia entre nodos, sino también aumentar el número de geodésicos en la red.

Dado que los nodos de la NSFnet tenían un límite máximo de tres vecinos directos, comencé por conectar los nodos de grado 2. Las opciones de 1 a 3 en la Tabla 2 muestran las diversas combinaciones y su efecto en el total de la red. Las mejoras fueron mínimas, si bien cada opción ofrece ventajas específicas. La opción 2 ofrece más mejoras que las otras.

Escenario

Número de geodésicos en la red

Centralización de la red

Camino más largo (saltos)

Longitud de camino promedio (saltos)

Diseño original (Figura 6)

200

0.062

4

2.370

Opción 1
(enlace añadido: SDSC-MID)

202

0.071

4

2.287

Opción 2
(enlace añadido: NW-DSC)

198

0.074

3

2.273

Opción 3
(enlace añadido: NW-MID)

202

0.050

4

2.356

Tabla 2. Posibles mejoras de la red

Las mejoras en la Opción 2 (enlace añadido: NW-SDSC) fue implementada de hecho en la versión de 1991 de la NSFnet –un excelente ejemplo de la dinámica de red de “restar sumando”. Las redes son sistemas complejos. Cómo responde la red al cambio es algo que se basa en la distribución y los patrones de conexiones a través de la red.

Conclusión

En el mundo real es posible que no tengamos la flexibilidad para experimentar con nuestro modelo de red que hemos tenido en estos ejemplos. Habrá más limitaciones. Los flujos de información en tu organización pueden requerir que pares específicos de routers tengan enlaces directos –incluso aunque dichas conexiones no fuesen recomendables de acuerdo con los algoritmos que hemos estado examinando. No obstante, cuando sabemos qué conexiones “tienen que estar”, podemos experimentar con la ubicación de las demás conexiones utilizando la métrica de las redes sociales para indicar cuándo nos estamos acercando a una topología robusta y eficiente. Dadas determinadas “condiciones iniciales”, los métodos de redes sociales pueden modelar nuestras redes de ordenadores y sugerir cambios en los enlaces[6] para conformar una topología efectiva, que tiene un bajo promedio de saltos, no demasiados caminos y suficiente redundancia.

Bibliografía

Burt, R. S. (1992). Structural Holes--The Social Structure of Competition. Harvard University Press.

Freeman, L. (1979). "Centrality in Social Networks: A Conceptual Clarification", Social Networks, 1, 1979.

Krackhardt, D. (1990). "Assessing the Political Landscape: Structure, Cognition, and Power in Organizations", Administrative Science Quarterly, 35, 351.

Krebs, V. (1996). "Visualizing Human Networks. Release 1.0.", Esther Dyson's Monthly Report, February.

Retana, A., Slice, D., White, R. (1999). Advanced IP Network Design. Cisco Press.

Watts D. & Strogatz S. (1998). "Collective Dynamics of Small World Networks", Nature, 4 June.

 



[1] Este artículo fue originalmente publicado en The Internet Protocol Journal (IPJ), 2000, Volume 3, Number 4, 14-25. El IPJ es una revista técnica cuatrimestral publicada por Cisco Systems: http://www.cisco.com/ipj. La versión en español se publica con permiso del autor y de los editores. Traducción de Isidro Maya Jariego.

[2] Correspondencia con el autor: valdis@orgnet.com. Orgnet es una consultora que aplica el análisis de redes de organizaciones en la gestión del conocimiento. Esta metodología se ha aplicado en la formulación de alianzas estratégicas, las comunidades de práctica, la formación de comunidades emergentes en Internet y el diseño de redes de ordenadores. Algunos de estos trabajos pueden visitarse en: http://www.orgnet.com.

[3] Un enrutador (router) es un dispositivo que conecta a redes de ordenadores, y que sirve para transmitir paquetes de datos entre las mismas. En este artículo mantenemos la terminología informática en inglés cuando se trata de términos más ampliamente extendidos que su traducción al español. [Nota del traductor]

[4] De acuerdo con la definición de Wikipedia <http://es.wikipedia.org/wiki/Portada> una red informática entre iguales es “una red que no tiene clientes y servidores fijos, sino una serie de nodos que se comportan simultáneamente como clientes y como servidores de los demás nodos de la red”. Se trata, por ejemplo, de las redes de usuarios que comparten música, archivos gráficos, etcétera. [N. del T.]

[5] Backbone o “columna vertebral” es la parte de la red que soporta el mayor volumen de tráfico. Es una ruta primaria para el tráfico en Internet, que con frecuencia proviene de unas redes y va hacia otras. [N. del T.]

[6] Conversaciones con Guy Hagen, colega investigador de redes, sobre modelos y algoritmos de combinatoria para la recomendación de cambios en la mejora de la topología global de una red.