Actualités Emploi Start-up Evénements 01 Avis d'expert Vidéos Indicateurs Telecharger Pro Livres blancs

Talend s'attaque aux gros volumes de fichiers

Les données oui, les fichiers moins…Talend, spécialiste open source de l'intégration, sait depuis longtemps transformer de gros volumes d'informations - de l'ordre du téraoctet - stockées en base. Mais en matière de fichiers - pour des opérations de tri, de fusion ou d'agrégation de lignes -, l'éditeur restait limité à quelques gigaoctets.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Les données oui, les fichiers moins…Talend, spécialiste open source de l'intégration, sait depuis longtemps transformer de gros volumes d'informations - de l'ordre du téraoctet - stockées en base. Mais en matière de fichiers - pour des opérations de tri, de fusion ou d'agrégation de lignes -, l'éditeur restait limité à quelques gigaoctets. Une lacune qu'il comble aujourd'hui avec le module MPX (Massive Parallel Extension), capable de trier un million de lignes en seulement une seconde. Un tel ratio peut s'avérer utile pour “ nettoyer ” les tickets d'appels des opérateurs par exemple.

“ Jusque-là, c'était la machine virtuelle de notre architecture Java qui restreignait les performances. Elle n'acceptait que 4 Go de RAM, et n'exploitait donc pas totalement les infrastructures physiques des serveurs ”, détaille Fabrice Bonan cofondateur et directeur général de Talend. Pour résoudre ce problème, l'éditeur a choisi de court-circuiter sa machine virtuelle Java en confiant les traitements à un module externe.

Une version pour chaque OS et matériel

Développé en C et en OCaml, ce binaire couvre une dizaine d'actions liées à la transformation de fichiers (contre une quinzaine dans la version en Java). “ Avec ce nouveau binaire, nous exploitons pleinement les 64 Go de mémoire vive des machines. Mais nous ne bénéficions plus de la portabilité de Java. Nous proposons donc une version pour chaque système d'exploitation et matériel ”, poursuit-il. A noter que le nouveau composant open source est payant. Il a nécessité trois années/homme de développement.

Intégration de données.
Produit : MPX.

MPX (Massive Parallel Extention) de Talend : module de traitement de fichiers. Supporte les modes 32 et 64 bits, les systèmes d'exploitation Windows, AIX, Red Hat et Open Solaris, ainsi que les processeurs AMD, Intel et Sparc.

A partir de 10 000 euros par utilisateur.

Synsort, Nsort (revendu par Informatica) et Ab Initio.

publicité
à lire aussi
SUR LES MÊMES THÈMES
Cyberbike (Wii)
Fireburst (PS3,360,PC)
Wintersports 2010 (Wii, 360)
Resident Evil The Darkside Chronicles (Wii)
Naviguer futé avec IE, Firefox, Chrome et Safari
LEGO Rock Band (Wii, PS3, 360)
Runaway : A twist of Fate (PC)
Greed (PC)
Ma vie passe par les mots de passe
Valtech notifie à l’AMF son refus de l’OPA hostile de SiegCo
2010 sera-t-elle l’année de Ruby ?
IBM abandonne le processeur Cell
Assassin's Creed 2 Discovery (DS)
LEGO Indiana Jones 2 : L'aventure continue (Multi)
Pokémon Donjon Mystère Explorateurs du Ciel (DS)
New Super Mario Bros (Wii)
L'Esprit du Loup (Wii, PC)
Gary Veale : « HP va appliquer le modèle des serveurs-lames au stockage »
PES 2010 (Wii)
Les Sims 3 Destination Aventure (PC)
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2009 Internext - 01net.