¿Cómo correr trabajos?
MANEJADORES DE TAREAS
Esta sección describe el uso de los manejadores de tareas utilizados en el SC3, los cuales constituyen la herramienta obligatoria paa la ejecución de trabajos
Ejecución de Programas Utilizando Slurm
¿Cómo Ejecutar Trabajos Seriales?
Para ejecutar programas seriales pasivos, es decir, que no requieran de alguna entrada de parámetros de forma interactiva, ejecute un comando como el que sigue:
Este comando ejecuta ./programa en alguno de los nodos del cluster. El argumento &> salida indica que tanto la salida como los errores se almacenan en un archivo de nombre salida que se creará en el mismo directorio desde donde se ejecutó el programa. Finalmente, el últmo caracter & es para liberar la cónsola desde donde se lanza la ejecución del programa.
Ejecutar Programas Utilizando OAR
¿Cómo Ejecutar Trabajos Seriales?
1) Editar un script shell, de nombre serial_job.sh, con el siguiente contenido
#!/bin/bash #OAR -n nombreDelTrabajo /camino/del/programa
Las primera línea indica que el archivo es un script shell. La segunda línea sirve para asignar un nombre al trabajo en el sistema de gestión de tareas. La última línea es el camino absoluto del programa que se desea ejecutar.
2) Luego, ubíquese en el mismo directorio donde creó el scrip shell anterior y ejecute el siguiente comando
¿Cómo Ejecutar Trabajos Paralelos MPI?
1) Editar un script shell, de nombre parallel_job.sh, con el siguiente contenido
#/bin/bash #OAR -n mpitest # cat $OAR_FILE_NODES | sort | uniq > nodos #Si descomenta esta línea podrá conocer cuales nodos le fueron asignados al trabajo mpirun -map-by node -mca btl ^openib -machinefile $OAR_FILE_NODES -np 96 ./programaParaleloEjecutable
Las primera línea indica que el archivo es un script shell. La segunda línea sirve para asignar un nombre al trabajo en el sistema de gestión de tareas. La siguiente línea está comentada (comienza con #), si la descomenta generará un archivo de nobre nodos que tendrá los nodos que le fueron asignados al trabajo. Finalmente, la última línea ejecutará el programa paralelo MPI. la opción -map-by node distribuye equitativamente los procesos entre los nodos asignados. La opción -machinefile $OAR_FILE_NODES indica en cuales nodos se ejecutará el programa paralelo; estos son seleccionados automáticamente por OAR.. La opción -np 96 indica cuantos procesos se generarán (usted lo puede cambiar según sus necesidades) y por último, ./programaParaleloEjecutable es el programa que se desea ejecutar.
2) Luego, ubíquese en el mismo directorio donde creó el scrip shell anterior y ejecute el siguiente comando
La opción -l nodes=2 indica que el trabajo se ejecutará en 2 nodos del cluster. Usted puede cambiar este valor a conveniencia.