Leadership Technologique

Depuis 2012, date à laquelle la première ligne de code de Retail Rocket a été écrite, l’équipe d’ingénierie et de data science de Retail Rocket est passionnée par le fait de changer le monde du E-commerce et de le rendre vraiment personnalisé.

Quelques chiffres brefs décrivant Retail Rocket :

Plus de 80 serveurs (Principalement en Allemagne).
Plus de 100 millions de visiteurs (unique cookies) traités tous les mois.
+ de 1000 sites marchands connectés à Retail Rocket à travers le monde.
450 000 + de 45 000 demandes externes par minute ( en moyenne).
+de 45 années consacrées au développement.

Approche de la data science

Le noyau de Retail Rocket consiste à identifier les besoins des utilisateurs de sites marchands en analysant leurs comportements et les bases de données des produits. C’est la data qui va générer les suggestions et les recommandations personnalisées en temps réel afin de booster la conversion. Cela nécessite l'utilisation de toutes les approches et algorithmes fondamentaux de pointe, notamment :

 

  • Filtrage du contenu.
  • Filtrage collaboratif.
  • Analyse prédictive basée sur le machine learning et les chaînes de Markov.
  • Statistiques Bayésiennes.
  • Algorithmes de personnalisation hybride en temps réel.

… Et bien plus



 
RRoman Zykov, Data Scientist en Chef de Retail Rocket, s'exprimant lors de la conférence annuelle RecSys 2016 @ Université MIT (Boston)

Activité dans la communauté de la Data Science

Notre équipe d'ingénieurs est un membre très actif de la communauté de la data science, avec un certain nombre de publications et de récompenses lors des concours de data science, ainsi que des conférences lors d'événements industriels importants.

img

 

 

spark
Clustering

Pour le machine learning, nous utilisons framework Spark basé sur la plateforme Hadoop Yarn - un système de calcul en cluster utilisant Scala - un langage de programmation fonctionnel. Quant aux composants natifs de Hadoop, nous utilisons Apache Flume pour le transfert des données, Mahout Machine Learning et Oozie scheduler.

L'équipe de Retail Rocket soutient un référentiel, le GitHub, avec un certain nombre de projets intéressants : Un simple moteur d’A/B testing en JavaScript, la bibliothèque Spark MultiTool pour Scala, le cluster Hadoop déployant des scripts à l'aide de Puppet.

 

iis8
Frontend

Presque tout ce avec quoi un utilisateur interagit est traité par les serveurs web d'IIS, le code est écrit en C #, Asp.Net MVC. Les bases de données que nous utilisons : Redis, MongoDB, PostgreSQL.

Lorsque nous devons exécuter les interactions entre des composants distribués, par exemple pour le calcul du segment utilisateur basé sur l'User-Agent (profilage d'audience), nous utilisons Thrift. Et pour construire le flux de data des sites marchands vers les différents sous-systèmes, nous utilisons Flume, déjà mentionné ci-dessus.

git
Processus de développement

Nous sommes partisans de la méthode de distribution continue comme étant la plus efficace pour nos clients (à ce jour, nous travaillons avec plus de 1000 boutiques).

Pour la soutenir, nous utilisons une chaîne de technologies Git + GitLab + TeamCity avec des tests unitaires automatisés (plus de 1200 au début de 2017), des tests d'acceptation et des procédures de révision de code.