Descarga gratuita mrjob Para Linux ::: Redes de clustering y distribuidos

mrjob

Software captura de pantalla:

Detalles de software:

Versión: 0.4

Fecha de carga: 20 Feb 15

Promotor: David Marin

Licencia: Libre

Popularidad: 66

Descargar

Currently 2.00/5
1
2
3
4
5

Rating: 2.0/5 (Total Votes: 3)

mrjob es un módulo de Python que le ayuda a escribir y ejecutar tareas de Hadoop Streaming.
mrjob totalmente compatible con el servicio de Amazon Elastic MapReduce (EMR), que le permite comprar tiempo en un clúster Hadoop sobre una base horaria. También funciona con su propio clúster Hadoop.
Instalación:
python setup.py install
Configuración de EMR en Amazon
& Nbsp; * crear una cuenta de Amazon Web Services: http://aws.amazon.com/
& Nbsp; * inscribirse para Elastic MapReduce: http://aws.amazon.com/elasticmapreduce/
& Nbsp; * Obtenga su acceso y claves secretas (ir a http://aws.amazon.com/account/ y haga clic en "Credenciales de seguridad") y establecer las variables de entorno $ AWS_ACCESS_KEY_ID y $ AWS_SECRET_ACCESS_KEY consecuencia

Pruébalo!
# Localmente
mrjob python / ejemplos / mr_word_freq_count.py README.md> recuentos
# En EMR
mrjob python / ejemplos / mr_word_freq_count.py README.md -r emr> recuentos
# En el clúster Hadoop
mrjob python / examples / mr_word_freq_count.py README.md -r Hadoop> recuentos
Configuración avanzada
Para ejecutar en otras regiones de AWS, cargue su árbol de código fuente, ejecute make, y utilizar otras funciones mrjob avanzadas, necesitará configurar mrjob.conf. mrjob busca su archivo conf en:
& Nbsp; * ~ / .mrjob
& Nbsp; * mrjob.conf cualquier lugar de su $ PYTHONPATH
& Nbsp; * /etc/mrjob.conf
Ver mrjob.conf.example para más información

Características :.

Ejecute trabajos sobre EMR, su propio clúster Hadoop, o localmente (para la prueba).
Escribir trabajos de varios pasos (un mapa-reducir paso se introduce en la siguiente)
Duplicar su entorno de producción dentro de Hadoop
Sube tu árbol de código fuente y lo puso en su trabajo de $ PYTHONPATH
No Ejecutar y otra configuración de scripts
Establezca las variables de entorno (por ejemplo $ TZ)
instalar fácilmente paquetes python de bolas de alquitrán (EMR solamente)
Configuración manejado de forma transparente por el archivo de configuración mrjob.conf
interpretar automáticamente los registros de error de EMR
túnel SSH a Job Tracker hadoop sobre EMR
configuración mínima
Para ejecutar el EMR, establezca $ AWS_ACCESS_KEY_ID y $ AWS_SECRET_ACCESS_KEY
Para ejecutar en el clúster Hadoop, establezca $ HADOOP_HOME

Requisitos :

Python

20 Feb 15 En Software de red, Redes de clustering y distribuidos

Comentarios a la mrjob

Búsqueda por categoría

mrjob

Programas parecidos

Mrs

Claun

Pyro

MPICH

Otro software de desarrollador David Marin

doloop

Comentarios a la mrjob

Comentarios que no se encuentran

Añadir comentario

Búsqueda por categoría

Aplicaciones recientemente vistos

SQL Server Data Access Components for RAD Studio XE2 25 Jan 15

Búsqueda por categoría

El software popular

Pyro 14 Apr 15

PepperMill 14 Apr 15

Openwsman 11 May 15

Linux NFS Utilities 14 Apr 15

Mrs 20 Feb 15

JPPF 11 Apr 16

Ehcache 11 May 15

mrjob

Programas parecidos

Mrs

Claun

Pyro

MPICH

Otro software de desarrollador David Marin

doloop

Comentarios a la mrjob

Comentarios que no se encuentran

Añadir comentario

Aplicaciones recientemente vistos

SQL Server Data Access Components for RAD Studio XE2 25 Jan 15

Búsqueda por categoría

El software popular

Tentakel 15 Apr 15

Berkeley Unified Parallel C 20 Feb 15

LAM/MPI 3 Jun 15

JPPF 11 Apr 16

Dapper Dataflow Engine 12 May 15

Linux NFS Utilities 14 Apr 15

openMosix 3 Jun 15