Condor

Software captura de pantalla:
Condor
Detalles de software:
Versión: 7.8.3
Fecha de carga: 20 Feb 15
Promotor: Condor Authors
Licencia: Libre
Popularidad: 22

Rating: 2.0/5 (Total Votes: 1)

Condor está influenciado tanto por los retos tecnológicos y sociológicos de un entorno de este tipo de computación,
Condor Team ha estado construyendo increíbles herramientas que permiten a los científicos e ingenieros para aumentar su rendimiento de computación

¿Qué hay de nuevo en esta versión:.

    < li> 7.6.X es la nueva serie Cóndor estable.
  • Se agregaron Muchas nuevas características desde 7.4.x.

¿Qué hay de nuevo en la versión 7.3.2:

  • Notas de la versión:
  • El formato de la salida de condor_status con la opción -grid se ha modificado para proporcionar la información más útil.
  • Se ha eliminado la nueva línea añadida al final de la producción -format condor_status. Por lo tanto, el código que analiza la salida de este comando ahora debe tener cuidado cuando se corta la última línea.
  • Nuevas características:
  • condor_fetchlog pueden ahora obtener los archivos de la historia de un demonio condor_schedd. Y, el archivo histórico mantenido por el demonio condor_schedd ahora se puede girar a diario o mensual.
  • El condor_ckpt_server limpiará automáticamente archivos de controles obsoletos. A continuación se describen las variables de configuración que controlan este comportamiento.
  • El condor_ckpt_server (ya sea la de 32 bits o 64 bits) ejecutable ahora comunicarse correctamente entre 32 bits y 64 bits presentan nodos. Si por alguna casualidad poco surgen problemas de ancho en el protocolo de control (por ejemplo, con tamaños de archivo), los mensajes de error claros se registran en los registros del servidor de punto de control.
  • La nueva herramienta permite condor_ssh_to_job depuración interactiva de trabajos en ejecución. Consulte la página de manual a [*] para más detalles.
  • El comando condor_status es ahora considerablemente más rápido, especialmente con la opción -format.
  • universo Rejilla tipo rejilla GT5 se ha añadido para su presentación al nuevo servicio Globus GRAM5. Cuando un servicio GRAM se identifica como GT5, el acelerador de Administrador de tareas y el Monitor de red no se utilizan. Vea la sección 5.3.2 para más detalles.
  • Cuadrícula universo de tipo rejilla crema se ha añadido para su presentación al servicio de empleo CREMA de gLite. Vea la sección 5.3.8 para más detalles.
  • Cuando baja en descriptores de archivo para la creación de nuevas conexiones de red, el demonio condor_schedd ahora evita el apilamiento ilimitado de mensajes que envía periódicamente a la condor_negotiator y condor_startd.
  • El manejo de rendimiento y el fracaso del Monitor de red se han mejorado.
  • Por tipo de cuadrícula NorduGrid en el universo de cuadrícula, la información de estado del trabajo se obtiene de utilizar el servidor LDAP de NorduGrid ARC, que debería mejorar considerablemente el rendimiento. Además, Condor ahora se da cuenta cuando estos trabajos se están ejecutando.
  • La nueva opción -valgrind a condor_submit_dag causas condor_submit_dag para generar un archivo de descripción de presentar que utiliza valgrind en condor_dagman, en vez del binario condor_dagman como su ejecutable.
  • condor_dagman ahora evalúa perezosamente y abre los archivos de registro de tareas de nodo. En lugar de analizar todos los archivos de descripción de presentar y abrir inmediatamente sus archivos de registro especificados en el arranque, condor_dagman ahora analiza el presentar los archivos de descripción sólo antes de la presentación de cada trabajo, y tiene cada archivo abierto de registro sólo cuando los trabajos pertinentes en la cola o la ejecución de scripts de la POST . Además, condor_dagman ahora genera automáticamente un archivo de registro de usuario predeterminado para cualquier trabajo de nodo que no especifica uno.

  • Se han eliminado
  • Tanto el apoyo y la documentación del universo MPI. Aplicaciones MPI son compatibles con el uso del universo paralelo.
  • Cuando la prueba de que el demonio condor_startd de software de la máquina virtual falla (para máquinas configuradas como capaz de ejecutar máquinas virtuales), la condor_startd volverá a intentar periódicamente la prueba hasta que lo consiga.
  • El nordugrid_gahp ahora limita el número de conexiones realizadas a cada servidor NorduGrid ARC y reutiliza conexiones cuando sea posible.
  • Se ha añadido la función eval ClassAd (), que toma un argumento de cadena y evalúa el contenido de la cadena como una expresión ClassAd. Un ejemplo de política cuando sea útil se describe en la sección 3.5.9 de suspensión de empleo.
  • El nuevo condor_q opción -attributes limita los atributos que se muestran cuando se utiliza el -xml u opciones -long. La limitación del número de atributos también aumenta la eficiencia de la consulta.
  • capacidades de administración de energía del Condor ahora se implementa como un plug-in. En particular, el condor_startd ahora se ejecuta un programa externo, como lo especifica el HIBERNATION_PLUGIN variable de configuración, para realizar la detección de estados de bajo consumo disponibles y la conmutación a estos estados de bajo consumo.
  • El nuevo condor_rooster demonio Cóndor ha sido añadido a despertar máquinas hibernación cuando la expresión se define en la configuración UNHIBERNATE variables se convierte en verdadera. Las variables de configuración relacionadas con condor_rooster se describen en la sección 3.3.35.
  • Se ha añadido la capacidad de extraer información de búfer estado del lector de registro de eventos de usuario para el lector de registro de usuario. Esto se implementa a través de una nueva clase de C ++ ReadUserLogStateAccess como se define en read_user_log.h.
  • Los cambios en el valor de la variable de configuración CERTIFICATE_MAPFILE o el contenido del archivo al que hace referencia ya no requieren un reinicio completo del Cóndor. En cambio, el condor_reconfig comando hará que los cambios sean efectivos.
  • El demonio condor_master imprimirá ahora la ruta y argumentos a los demonios de su inicio si D_FULLDEBUG está habilitada. Anteriormente, no había manera de conseguir que se muestre los argumentos con los que estaba empezando un demonio.
  • El demonio condor_had ahora tiene la capacidad de controlar los demonios distintas de la condor_negotiator. Esto se controla a través de la macro HAD_CONTROLLEE.
  • Condor ahora reconoce VOMS extensiones en proxies X.509. Los atributos VOMS están codificados en el trabajo ClassAd atribuir X509UserProxySubject.
  • El condor_startd ahora puede limpiar máquinas virtuales varados, a raíz de un accidente de Condor o su sistema operativo host.
  • Después de un accidente, el condor_gridmanager ya no reinicia todos los jobmanagers para trabajos GT2. Esto debería mejorar el tiempo de recuperación.
  • Condor funciona mejor con los ClassAds categorizados como genérico en el demonio condor_collector. Varios demonios que se registren con ClassAds genéricos pueden ahora contar con herramientas que utilizan la opción -subsystem manipular sus ClassAds correctamente.
  • Condor ahora proporciona un mecanismo para hacer cumplir estrictamente recurso limitante para algunos universos de trabajos en ejecución.
  • Configuración Adiciones variables y cambios:
  • La nueva variable de configuración EMAIL_SIGNATURE especifica una firma personalizada que se adjunta a un correo electrónico enviado por el sistema Cóndor. Si se define, entonces esta firma personalizada sustituye al predeterminado especificado internamente. No hay valor predeterminado para esta variable.
  • El CKPT_SERVER_CLIENT_TIMEOUT nueva variable de configuración informa a los condor_schedd en segundos el tiempo que está dispuesto a esperar para tratar de hablar con un proceso condor_ckpt_server antes de declarar una condor_ckpt_server abajo. Vea la sección 3.3.11 para la descripción completa.
  • La nueva variable de configuración CKPT_SERVER_CLIENT_TIMEOUT_RETRY informa al condor_schedd que una vez al condor_ckpt_server se ha marcado como abajo, ¿cómo pueden segundos deben pasar antes de que el condor_schedd intentará comunicarse con el condor_ckpt_server nuevo. Vea la sección 3.3.11 para la descripción completa.
  • La nueva variable de configuración CKPT_SERVER_REMOVE_STALE_CKPT_INTERVAL informa al condor_ckpt_server para comenzar la eliminación de puestos de control obsoletos en el intervalo especificado en segundos. Vea la sección 3.3.8 para la descripción completa.
  • La nueva variable de configuración CKPT_SERVER_STALE_CKPT_AGE_CUTOFF informa al condor_ckpt_server la edad que el tiempo de acceso de un archivo de controles debe ser con el fin de ser considerado obsoleto. Esta vez se compara con la noción actual de ahora cuando el servidor puesto de control comprueba el archivo de imagen de punto de control. Vea la sección 3.3.8 para la descripción completa.
  • El SlotWeight nueva variable de configuración puede ser usado para dar una ranura de mayor peso en el cálculo de uso, informática acciones justas, y hacer cumplir las cuotas de grupo. Ver 3.3.10 para la descripción completa.
  • La nueva variable de configuración MAX_PERIODIC_EXPR_INTERVAL implementa un tope en el tiempo entre la evaluación de expresiones periódicas, debido a los tiempos de adaptación que implica el PERIODIC_EXPR_TIMESLICE variable de configuración. Ver 3.3.11 para la descripción completa.
  • El GRIDMANAGER_SELECTION_EXPR nueva variable de configuración puede utilizarse para controlar el número de procesos condor_gridmanager se generó para administrar los trabajos universo de cuadrícula. Como parte de este cambio, eliminado la variable de configuración y el código de apoyo para GRIDMANAGER_PER_JOB ya que la nueva variable de configuración que reemplaza. Ver 3.3.11 para la descripción completa.
  • El GRIDMANAGER_MAX_PENDING_SUBMITS_PER_RESOURCE variable de configuración y los correspondientes GRIDMANAGER_MAX_PENDING_SUBMITS acelerador se han eliminado.
  • La nueva configuración de los controles GRID_MONITOR_DISABLE_TIME variable de cuánto tiempo el condor_gridmanager esperará después de encontrarse con un error antes de intentar reiniciar un trabajo de cuadrícula Monitor. Ver 3.3.23 para la descripción completa.
  • El nuevo macro configuración DETECTED_MEMORY predefinido indica la cantidad de memoria física (RAM) detectada por Condor. El valor se da en Mbytes.
  • Las nuevas macro configuración DETECTED_CORES predefinidos indica el número de núcleos de CPU detectados por Condor.
  • Los controles DELEGATE_FULL_JOB_GSI_CREDENTIALS variables nueva configuración si un proxy X.509 plena o limitada se delega por tipo rejilla empleos universo rejilla GT2. Ver 3.3.26 para la descripción completa.
  • La nueva configuración UNHIBERNATE variable es usada por el condor_startd hacer publicidad en su ClassAd una expresión booleana que especifica si la máquina debe ser despertada, por ejemplo, por condor_rooster. Ver 3.3.10 para la descripción completa.
  • La nueva variable de configuración HIBERNATION_PLUGIN especifica la ruta para el plug-in que el condor_startd utiliza tanto para detectar las bajas capacidades estatales de energía de una máquina y para cambiar el equipo a un estado de bajo consumo. Ver 3.3.10 para la descripción completa.
  • La nueva configuración HIBERNATION_PLUGIN_ARGS variable especifica los argumentos de línea de comandos adicionales que el condor_startd pasará al complemento cuando la invoca para cambiar el equipo a un estado de bajo consumo. Ver 3.3.10 para la descripción completa.
  • El HIBERNATION_OVERRIDE_WOL nueva variable de configuración puede utilizarse para dirigir la condor_startd ignorar Wake On LAN (WOL) capacidades de interfaz de red de la máquina, y para cambiar a un estado de bajo consumo aunque la interfaz no soporta WOL, o si WOL está deshabilitado en él. Ver 3.3.10 para la descripción completa.
  • Los controles DAGMAN_USER_LOG_SCAN_INTERVAL variables nueva configuración cuánto tiempo condor_dagman esperas entre comprobar los archivos de registro de empleo para las actualizaciones de estado. Ver 3.3.25 para la descripción completa.
  • La nueva variable de configuración DAGMAN_DEFAULT_NODE_LOG establece el nombre de archivo de registro predeterminado para la nueva función de archivo de registro de nodo condor_dagman defecto. Ver 3.3.25 para la descripción completa.
  • Se ha eliminado el DAGMAN_DELETE_OLD_LOGS variables de configuración; nuevo código de lectura del archivo de registro hace que sea obsoleto.
  • La nueva variable de configuración HAD_CONTROLLEE se utiliza para especificar el nombre del demonio que los controles condor_had. Este nombre debe coincidir con el nombre de demonio en daemon_list del condor_master.
  • Errores solucionados:
  • Se ha corregido un error en funciones ClassAd donde los argumentos que deberían haber sido coaccionados correctamente en cadenas en vez evaluados para ERROR.
  • Se ha corregido un mensaje de diagnóstico confuso con la JobRouter, lo que sucedió cuando se eliminó un puesto de trabajo dentro de los 5 minutos de ser presentado.
  • Se ha corregido un error en el que el uso de las franjas horarias dinámicas (ver sección 3.13.7) causaron los ClassAd máquina atribuyen SLOT_STARTD_ATTRS desaparezca de la ClassAd para algunas franjas horarias.
  • Se ha corregido un error de la plataforma de Windows en la que la ventana que pertenece a un trabajo Cóndor no recibe un mensaje de dibujo.
  • Se ha corregido un error que causaba -Analizar condor_q a bloquearse cuando no había ningún archivo ClassAd demonio condor_schedd.
  • Se ha corregido un accidente condor_procd causada cuando el entorno de un proceso supervisado supera 1MByte en / proc.
  • Se ha corregido un error de la plataforma de Windows que podría causar la condor_credd a bloquearse si una credencial solicitada no se encuentra en el almacén de contraseñas.
  • Se ha corregido un error que causaba el bloqueo de rotación de registro de eventos de empleos a crearse con permisos incorrectos.
  • Se ha corregido un error en la rotación del registro de eventos de trabajo que podría hacer que nunca para ser rotado en el puerto de Windows del Cóndor.
  • Se ha corregido un estado potencial de la raza en la inicialización del registro de eventos de trabajo.
  • condición de carrera fijo que podría causar un accidente de la condor_collector y condor_schedd en el apagado.
  • Se ha corregido un error en el que el condor_master veces iba a morir y producir un archivo dprintf_failure.MASTER cuando reiniciando debido a las nuevas marcas de tiempo binarias o cuando comenzó inicialmente.
  • Fija una pérdida de memoria relacionada con las variables de configuración SOAP que se produjo cuando Cóndor fue reconfigurado.
  • Se ha corregido un error en el que el comando descripción del archivo cron_day_of_week presentar fue ignorado erróneamente.
  • Solución de error en el que las variables de configuración MAX_JOB_QUEUE_LOG_ROTATIONS y GRIDMANAGER_SELECTION_EXPR no funcione correctamente en el arranque; solo funcionaban después de un condor_reconfig.
  • Se ha corregido un error en el que las operaciones de SOAP se estaban incorrectamente autorizados con el IP de pares.
  • Se ha corregido un error de la plataforma de Windows en la que no todos los demonios de Condor se confiaba en el Firewall de Windows (anteriormente conocido como Internet Connection Firewall o ICF).
  • Se ha corregido un estado de carrera de cierre en el condor_master con respecto a los demonios de alta disponibilidad.
  • Se ha corregido un error en el que un demonio Cóndor determinó incorrectamente que se había quedado sin descriptores de socket.
  • Se ha corregido un error por el que el condor_schedd bloquearía durante largos períodos de tiempo al intentar conectarse a un servidor de punto de control hacia abajo. Ahora el condor_schedd hará un bloqueo conectar con un tiempo de espera en el servidor de punto de control para un número configurable de segundos. Si falla la conexión, la condor_schedd pondrá una moratoria sobre la conexión con el servidor de punto de control hasta que las configurables pases período de moratoria. Las variables del archivo de configuración que describen este comportamiento se han descrito anteriormente.
  • Se ha cambiado el cheque que condor_dagman hace por otras instancias condor_dagman que ejecutan el mismo DAG, si encuentra un archivo de bloqueo en el arranque. Ahora, si condor_dagman no es seguro si el otro Dagman está vivo, continúa, en lugar de salir.
  • Se ha corregido un importante fuga de descriptor de archivo en el demonio de la cigüeña.
  • Se ha corregido un error en el cual las transferencias Cigüeña exitosas se han marcado como fallido.
  • Se ha solucionado un pérdida de memoria poco común en el código de lectura de archivos de registro de eventos de usuario al leer eventos mal formateados.
  • Se ha corregido un error en el que múltiples ClassAds máquina en el condor_collector con el mismo nombre, pero diferentes valores de atributos StartdIPAddr, causarían la condor_negotiator para salir con un error. Esto es inusual y no debería ocurrir en una instalación típica Condor. La causa más probable está utilizando condor_advertise para anunciar ClassAds personalizados para matchmaking red.
  • Se ha corregido un error que hacía que condor_dagman de volcado de memoria si todo submit intentos fracasaron en un nodo DAG tener un guión POST. Este error ha existido desde Cóndor versión 7.1.4.
  • Fija una pérdida de memoria en el condor_schedd, que se produjo cuando se utilizó el NEGOTIATOR_MATCH_EXPRS variable de configuración.
  • Se ha corregido un error en el código plataforma Windows que trata a los scripts como ejecutables. Extensiones de archivos desconocidos fueron tratados como un error, y no como un ejecutable de Windows.
  • El condor_job_router ahora establece correctamente el ClassAd atributo EnteredCurrentStatus a la hora actual cuando se crea un nuevo trabajo enrutado. Anteriormente, se copió este atributo del trabajo original.
  • El condor_job_router emite un mensaje de registro más amigable cuando se observa que se retiró la copia enrutado del trabajo.
  • Una revisión se ha realizado para un problema visto en 7.3.1 en el que los demonios Condor utilizando CCB se conecten a otros demonios Condor que a veces consumen grandes cantidades de tiempo de CPU para ninguna buena razón.
  • Se ha corregido un error raro caso de error en el que intenta conectarse a través de CCB podrían permanecer en un estado pendiente de forma indefinida.
  • Un Unix único fallo causó demonios Condor no se inicie si MAX_FILE_DESCRIPTORS fue configurado por encima del límite duro actual heredada por Condor. Si Cóndor se está ejecutando como root, esto ya no es el caso.
  • El condor_gridmanager ahora anuncia ClassAds rejilla correctamente cuando hay varios demonios condor_collector.
  • Cuando se utiliza -xml condor_q y -format juntos para limitar el número de ClassAd atributos devueltos en la consulta, la etiqueta contenedor XML no fue generada. Esta es fija, pero ahora la forma que prefiera para limitar los atributos devueltos es utilizar -attributes opción condor_q.
  • Se ha corregido un error en el que el condor_master Unix fracasó al intentar reiniciar en sí, si se definió la MASTER_LOCK variable de configuración, o si el condor_master se invocó con la opción -t. Este error ha existido desde que la serie 7.0, y probablemente ha existido mucho más tiempo que eso.
  • Fija una pérdida de memoria significativa en el gahp_server. Esta fuga sólo estaba presente en las versiones 7.3.x Condor anteriores.
  • Se ha corregido un error que puede hacer un trabajo eliminado que se celebra y luego puesto en libertad para volver al estado de reposo.
  • Los archivos jar Globus distribuidos con el x86-64 RHEL 5 RPM fueron dañados, haciendo que los trabajos de tipo rejilla GT4 fallen. Esto se ha solucionado.

¿Cuál es nuevo en la versión 7.2.2:

  • Ha añadido un puerto lleno de Cóndor para Debian 5.0 en la plataforma x86.
  • Ha añadido un puerto recortado del Cóndor para Debian 5.0 en la plataforma x86_64.
  • Se ha añadido la bandera de línea de comandos -DumpRescue a condor_dagman y condor_submit_dag. Esta bandera se destina principalmente para la prueba.
  • Se ha añadido soporte para la opción -debug a condor_qedit.
  • El Router de empleo ahora utiliza un temporizador de intervalo de tiempo para la evaluación de la expresión periódica, similar al demonio condor_schedd. El intervalo de evaluación es controlado por el PERIODIC_EXPR_INTERVAL variable de configuración, y por defecto a 60 segundos, el mismo valor por defecto utilizado por el demonio condor_schedd.
  • El Router de empleo ahora reinicia el trabajo de origen, si se produce un error al actualizar el demonio condor_schedd para una expresión periódica que evalúa a True. Expresiones periódicas del trabajo deben ser evaluados de nuevo algún tiempo en el futuro con una actualización correcta.

¿Qué hay de nuevo en la versión 7.2.0:.

  • Las principales mejoras de características

¿Qué hay de nuevo en la versión 7.0.5:

  • Este comunicado contiene muchas correcciones de errores y algunas mejoras a error manejo de puestos de trabajo del Universo Local.
  • Tenga en cuenta que algunas de las soluciones a fallos son relacionados con la seguridad; Por lo tanto, los sitios deben actualizar o restringir los permisos de quién está autorizado a enviar trabajos Condor a usuarios de confianza.

Programas parecidos

LAPACK
LAPACK

17 Feb 15

Son of Grid Engine
Son of Grid Engine

19 Feb 15

EC2Box
EC2Box

22 Jun 18

Comentarios a la Condor

Comentarios que no se encuentran
Añadir comentario
A su vez en las imágenes!