Conceptos Clave de Sistemas Operativos y Programación Concurrente

Programa

Toda la información (tanto código como datos) almacenada en disco de una aplicación que resuelve una necesidad concreta para los usuarios.

Proceso

Programa en ejecución. Este concepto no se refiere únicamente al código y a los datos, sino que incluye todo lo necesario para su ejecución:

  • Contador de programa.
  • Imagen de memoria.
  • Estado del procesador.

Ejecutable

Fichero que contiene la información necesaria para crear un proceso a partir de los datos almacenados de un programa.

Demonio

Proceso no interactivo que está ejecutándose continuamente en segundo plano. Suele proporcionar un servicio básico para el resto de procesos.

Sistema Operativo

Programa que hace de intermediario entre el usuario y las aplicaciones que utiliza y el hardware del ordenador. Entre su funcionalidad:

  • Hace de interfaz entre el usuario y los recursos del ordenador.
  • Permite utilizar los recursos del computador de forma eficiente.
  • Ejecuta los programas del usuario.

Programación Concurrente

Un único procesador (multiprogramación)

  • Si solamente existe un único procesador, solamente un proceso puede estar en un momento determinado en ejecución.
  • El sistema operativo se encarga de cambiar el proceso en ejecución después de un período corto de tiempo (del orden de milisegundos) creando en el usuario la percepción de que múltiples programas se están ejecutando al mismo tiempo (programación concurrente).
  • La programación concurrente no mejora el tiempo de ejecución global de los programas ya que se ejecutan intercambiando unos por otros en el procesador. Sin embargo, permite que varios programas parezca que se ejecuten al mismo tiempo.

Varios núcleos en un mismo procesador (multitarea)

  • Cada núcleo podría estar ejecutando una instrucción diferente al mismo tiempo.
  • El sistema operativo se encarga de planificar los trabajos que se ejecutan en cada núcleo y cambiar unos por otros para generar multitarea.
  • Todos los cores comparten la misma memoria por lo que es posible utilizarlos de forma coordinada (programación paralela).
  • La programación paralela permite mejorar el rendimiento de un programa ya que permite que se ejecuten varias instrucciones a la vez.

Varios ordenadores distribuidos en red

  • Cada uno de los ordenadores tendrá sus propios procesadores y su propia memoria (programación distribuida).
  • La programación distribuida posibilita la utilización de un gran número de dispositivos de forma paralela, lo que permite alcanzar elevadas mejoras en el rendimiento de la ejecución de programas distribuidos.
  • Como cada ordenador posee su propia memoria, imposibilita que los procesos puedan comunicarse fácilmente, teniendo que utilizar otros esquemas de comunicación más complejos y costosos a través de la red que los interconecte.

Kernel

Parte central del sistema operativo responsable de gestionar los recursos del ordenador, permitiendo su uso a través de llamadas al sistema.

  • Parte pequeña del sistema operativo, si la comparamos con lo necesario para implementar su interfaz.
  • A todo lo demás del sistema operativo se le denomina programas del sistema.
  • Funciona en base a interrupciones. Una interrupción es una suspensión temporal de la ejecución de un proceso, para pasar a ejecutar una rutina que trate dicha interrupción.
  • Cuando salta una interrupción se transfiere el control a la rutina de tratamiento de la interrupción.
  • Mientras se está atendiendo una interrupción, se deshabilita la llegada de nuevas interrupciones.
  • Cuando finaliza la rutina, se reanuda la ejecución del proceso en el mismo lugar donde se quedó cuando fue interrumpido.

Llamadas al Sistema

Interfaz que proporciona el kernel para que los programas de usuario puedan hacer uso de forma segura de determinadas partes del sistema.

Modo Dual

Característica del hardware que permite al sistema operativo protegerse.

El procesador tiene dos modos de funcionamiento:

  • 0. Modo kernel, llamado “modo supervisor” o “modo privilegiado”.
  • 1. Modo usuario. Utilizado para la ejecución de programas de usuario.

Estados de un Proceso

Los procesos pueden cambiar de estado a lo largo de su ejecución. Se definen los siguientes estados:

  • Nuevo: el proceso está siendo creado a partir del fichero ejecutable.
  • Listo: el proceso no se encuentra en ejecución aunque está preparado para hacerlo. El sistema operativo no le ha asignado todavía un procesador para ejecutarse.
  • En ejecución: el proceso se está ejecutando. El sistema operativo utiliza el mecanismo de interrupciones para controlar su ejecución.
  • Bloqueado: el proceso está bloqueado esperando que ocurra algún suceso. Cuando ocurre el evento que lo desbloquea, el proceso no pasa directamente a ejecución sino que tiene que ser planificado de nuevo por el sistema.
  • Terminado: el proceso ha finalizado su ejecución y libera su imagen de memoria.

Colas de Procesos

Los procesos se van intercambiando el uso del procesador para su ejecución de forma concurrente. Para ello, el sistema operativo organiza los procesos en varias colas, migrando los procesos de unas a otras:

  • Cola de procesos: contiene todos los procesos del sistema.
  • Cola de procesos preparados: contiene todos los procesos listos esperando para ejecutarse.
  • Cola de dispositivo: por cada dispositivo hay una cola diferente que contiene los procesos que están a la espera de alguna operación de E/S.

Planificación de Procesos

El planificador es el encargado de seleccionar los movimientos de procesos entre las diferentes colas. Dos tipos de planificación:

  • A corto plazo:
    • Selecciona qué proceso de la cola de procesos preparados pasará a ejecución.
    • Se invoca del orden de milisegundos, cuando se produce un cambio de estado del proceso en ejecución.
    • Decisión rápida: algoritmos de planificación sencillos.
  • A largo plazo:
    • Selecciona qué procesos nuevos deben pasar a la cola de procesos preparados.
    • Se invoca con poca frecuencia, por lo que puede tomarse más tiempo en tomar la decisión.
    • Controla el grado de multiprogramación (número de procesos en memoria).

Planificación a corto plazo

  • Planificación sin desalojo o cooperativa:
    • Únicamente se cambia el proceso en ejecución si dicho proceso se bloquea o termina.
  • Planificación apropiativa:
    • Se cambia el proceso en ejecución si en cualquier momento en que un proceso se está ejecutando, otro proceso con mayor prioridad se puede ejecutar.
    • La aparición de un proceso más prioritario se puede deber tanto al desbloqueo del mismo como a la creación de un nuevo proceso.
  • Tiempo compartido:
    • Cada cierto tiempo (llamado cuanto) se desaloja el proceso que estaba en ejecución y se selecciona otro proceso para ejecutarse.
    • Todas las prioridades de los procesos se consideran iguales.

Cambio de Contexto

  • Cuando el procesador pasa a ejecutar otro proceso, el sistema operativo guarda el contexto del proceso actual y restaura el contexto del proceso que el planificador a corto plazo ha elegido ejecutar.
  • Se conoce como contexto a:
    • Estado del proceso.
    • Estado del procesador.
    • Información de gestión de memoria.
  • La salvaguarda de la información del proceso en ejecución se produce cuando hay una interrupción.
  • El cambio de contexto es tiempo perdido, ya que el procesador no hace trabajo útil durante ese tiempo y su duración depende de la arquitectura en concreto del procesador.

Gestión de Procesos

El sistema operativo es el encargado de crear los nuevos procesos siguiendo las directrices del usuario.

  • La puesta en ejecución de un nuevo proceso se produce debido a que hay un proceso en concreto que está pidiendo su creación en su nombre o en nombre del usuario.
  • Cualquier proceso en ejecución (proceso hijo) siempre depende del proceso que lo creó (proceso padre), estableciéndose un vínculo entre ambos. A su vez, el nuevo proceso puede crear nuevos procesos, formándose lo que se denomina un árbol de procesos.

Operaciones básicas

  • Creación de procesos. Cuando se crea un nuevo proceso hijo, ambos procesos, padre e hijo se ejecutan concurrentemente.
    • Ambos procesos comparten la CPU y se irán intercambiando siguiendo la política de planificación.
    • Si el proceso padre necesita esperar hasta que el hijo termine su ejecución, puede hacerlo mediante la operación wait.
    • Los procesos son independientes y tienen su propio espacio de memoria asignado, llamado imagen de memoria.
  • Terminación de procesos. Al terminar la ejecución de un proceso, es necesario avisar al sistema operativo de su terminación para liberar los recursos que tenga asignados.
    • En general, es el propio proceso el que le indica al sistema mediante la operación exit que quiere terminar, pudiendo aprovechar para mandar información de su finalización al padre.

Terminación de Procesos

  • El proceso hijo realizará su ejecución completa terminando y liberando sus recursos al finalizar.
  • Esto se produce cuando el hijo realiza la operación exit para finalizar su ejecución.
  • Un proceso padre puede además terminar de forma abrupta un proceso hijo que creó mediante la operación destroy.
    • Esta operación elimina el proceso hijo indicado liberando sus recursos en el sistema operativo subyacente.
    • En Java, los recursos correspondientes los eliminará el garbage collector cuando considere.

Comunicación de Procesos

Un proceso recibe información, la transforma y produce resultados mediante su:

  • Entrada estándar (stdin): lugar de donde el proceso lee los datos de entrada que requiere para su ejecución.
    • Normalmente es el teclado.
    • No se refiere a los parámetros de ejecución del programa.
  • Salida estándar (stdout): sitio donde el proceso escribe los resultados que obtiene.
    • Normalmente es la pantalla.
  • Salida de error (stderr): sitio donde el proceso envía los mensajes de error.
    • Habitualmente es el mismo que la salida estándar, pero puede especificarse que sea otro lugar, cómo un fichero.

En Java, el proceso hijo no tiene su propia interfaz de comunicación, por lo que el usuario no puede comunicarse con él directamente.

Stdin, stdout y stderr están redirigidas al proceso padre a través de los flujos de datos:

  • OutputStream: flujo de salida del proceso hijo.
    • El stream está conectado por un pipe a la entrada estándar (stdin) del proceso hijo.
  • InputStream: flujo de entrada del proceso hijo.
    • El stream está conectado por un pipe a la salida estándar (stdout) del proceso hijo.
  • ErrorStream: flujo de error del proceso hijo.
    • El stream está conectado por un pipe a la salida estándar (stderr) del proceso hijo.
    • Por defecto, está conectado al mismo sitio que stdout.

Además de la posibilidad de comunicarse mediante flujos de datos, existen otras alternativas para la comunicación de procesos:

  • Usando sockets.
  • Utilizando JNI (Java Native Interface) para acceder desde Java a aplicaciones en otros lenguajes de programación de más bajo nivel, que pueden sacar partido al sistema operativo subyacente.
  • Librerías de comunicación no estándares entre procesos. Permiten aumentar las capacidades del estándar Java para comunicar procesos mediante:
    • Memoria compartida: se establece una región de memoria compartida entre varios procesos a la cual pueden acceder todos ellos.
    • Pipes: permite a un proceso hijo comunicarse con su padre a través de un canal de comunicación sencillo.
    • Semáforos: mecanismo de bloqueo de un proceso hasta que ocurra un evento.

Sincronización de Procesos

Los métodos de comunicación de procesos se pueden considerar como métodos de sincronización ya que permiten al proceso padre llevar el ritmo de envío y recepción de mensajes. Además de la utilización de los flujos de datos se puede esperar por la finalización del proceso hijo mediante la operación wait.

  • Bloquea al proceso padre hasta que el hijo finaliza su ejecución mediante exit.
  • Como resultado el padre recibe la información de finalización del proceso hijo.
    • El valor de retorno especifica mediante un número entero, cómo resulto la ejecución.
    • No tiene nada que ver con los mensajes que se pasan padre e hijo a través de los streams.
    • Por convención se utiliza 0 para indicar que el hijo ha acabado de forma correcta.

Programación Multiproceso

La programación concurrente es una forma eficaz de procesar la información al permitir que diferentes sucesos o procesos se vayan alternando en la CPU para proporcionar multiprogramación.

  • El sistema operativo se encarga de proporcionar multiprogramación entre todos los procesos del sistema.
    • Oculta esta complejidad tanto a los usuarios como a los desarrolladores.
  • Si se pretende realizar procesos que cooperen entre sí, debe ser el propio desarrollador quien lo implemente utilizando comunicación y sincronización de procesos.

Fases

  • Descomposición funcional. Identificar previamente las diferentes cosas que debe realizar la aplicación y las relaciones existentes entre ellas.
  • Partición. Distribución de las diferentes funciones en procesos estableciendo el esquema de comunicación entre los mismos.
    • La comunicación entre procesos requiere una pérdida de tiempo tanto de comunicación como de sincronización.
    • El objetivo debe ser maximizar la independencia entre los procesos minimizando la comunicación entre los mismos.
  • Implementación. En este caso, Java permite únicamente métodos sencillos de comunicación y sincronización de procesos para realizar la cooperación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.