Actualités Emploi Start-up Evénements 01 Avis d'expert Vidéos Indicateurs Telecharger Pro Livres blancs

Talend s'attaque aux gros volumes de fichiers

Les données oui, les fichiers moins…Talend, spécialiste open source de l'intégration, sait depuis longtemps transformer de gros volumes d'informations - de l'ordre du téraoctet - stockées en base. Mais en matière de fichiers - pour des opérations de tri, de fusion ou d'agrégation de lignes -, l'éditeur restait limité à quelques gigaoctets.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Les données oui, les fichiers moins…Talend, spécialiste open source de l'intégration, sait depuis longtemps transformer de gros volumes d'informations - de l'ordre du téraoctet - stockées en base. Mais en matière de fichiers - pour des opérations de tri, de fusion ou d'agrégation de lignes -, l'éditeur restait limité à quelques gigaoctets. Une lacune qu'il comble aujourd'hui avec le module MPX (Massive Parallel Extension), capable de trier un million de lignes en seulement une seconde. Un tel ratio peut s'avérer utile pour “ nettoyer ” les tickets d'appels des opérateurs par exemple.

“ Jusque-là, c'était la machine virtuelle de notre architecture Java qui restreignait les performances. Elle n'acceptait que 4 Go de RAM, et n'exploitait donc pas totalement les infrastructures physiques des serveurs ”, détaille Fabrice Bonan cofondateur et directeur général de Talend. Pour résoudre ce problème, l'éditeur a choisi de court-circuiter sa machine virtuelle Java en confiant les traitements à un module externe.

Une version pour chaque OS et matériel

Développé en C et en OCaml, ce binaire couvre une dizaine d'actions liées à la transformation de fichiers (contre une quinzaine dans la version en Java). “ Avec ce nouveau binaire, nous exploitons pleinement les 64 Go de mémoire vive des machines. Mais nous ne bénéficions plus de la portabilité de Java. Nous proposons donc une version pour chaque système d'exploitation et matériel ”, poursuit-il. A noter que le nouveau composant open source est payant. Il a nécessité trois années/homme de développement.

Intégration de données.
Produit : MPX.

MPX (Massive Parallel Extention) de Talend : module de traitement de fichiers. Supporte les modes 32 et 64 bits, les systèmes d'exploitation Windows, AIX, Red Hat et Open Solaris, ainsi que les processeurs AMD, Intel et Sparc.

A partir de 10 000 euros par utilisateur.

Synsort, Nsort (revendu par Informatica) et Ab Initio.

publicité
à lire aussi
SUR LES MÊMES THÈMES
L'esprit du Loup (PC, Wii)
The Legend of Zelda : Spirit Tracks (DS)
Tekken (PSP)
The Saboteur
Art of Murder : La Traque du Marionettiste (PC)
Arthur et la Vengeance de Maltazard (PS3, Wii)
Star Wars : Le Pouvoir de la Force - Ultimate Sith Edition
Un euro par abonnement Internet pour aider la filière musicale ?
Le Seigneur des Anneaux Online : Le Siège de la Forêt Noire
Colin McRae : DiRT 2 (PC)
Avatar
Intel met 48 serveurs dans un seul processeur
Un Noël très tendance
SFR recrute 100 bêta-testeurs pour son décodeur HD
Buzz ! Quiz World
La croissance de Sage stoppée par la crise financière
IBM porte sa console de supervision dans l’environnement EC2
Atterrissage en douceur pour les ventes de serveurs en 2009
Adequajob : l'entreprise ne paie que si elle recrute
Comme vous, 01net est aussi sur Facebook
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2009 Internext - 01net.