Ebonus : du BIG DATA au SMALL DATA (Usage-Based-Insurance)
14-03-2014

      Si le coût de la technologie n’a cessé de diminuer au cours de ces 3 dernières années incitant certains assureurs à se lancer dans l’assurance sur mesure (Usage-Based-Insurance), le stockage et la sécurisation des données commencent aujourd’hui à poser de sérieux problèmes. C’est pourquoi en prévision d’une augmentation rapide du nombre de véhicules connectés, beaucoup de fournisseurs de solutions télématiques s’interrogent et réfléchissent à la mise en place d’un standard pour rentrer dans l’ère BIG DATA en évitant de créer de véritables usines à gaz énergivores et coûteuses.        

Cliquer ici pour la version anglaise                                                                             

                         

“Scoring” ou “Enregistrement continu” ?

 S’interroger sur l’enregistrement et la sécurisation des données nécessite en premier lieu de s’interroger sur la source, c’est à dire sur l’émetteur de ces données. Dans le domaine de l’assurance télématique, on peut considérer qu’en termes d’émetteurs ou enregistreurs de données, deux solutions ont été expérimentées :

- les solutions d’enregistrement fonctionnant en continu qui acheminent vers un serveur informatique une multitude d’informations capteurs prélevées tout au long de chaque trajet. Cet énorme volume de données est ensuite traité et analysé par des puissants calculateurs et permet d’avoir une vision globale du comportement des conducteurs. C’est le principal avantage de ce type de solution. L’analyse de l’ensemble de ces données permet généralement à l’assureur de définir une stratégie marketing suivie d’une offre commerciale ciblée sur les risques identifiés. Néanmoins, de part le coût élevé lié au stockage et à la sécurisation des données, ce type de solution n’est envisageable que pour des phases expérimentales avec un nombre réduit de véhicules. Pour une application commerciale à plus grande échelle, le nombre de paramètres enregistrés se limite généralement à des données simples comme l’heure de départ et d’arrivée, le temps de conduite ou encore la position ou les accélérations / décélérations du véhicule.

- les solutions de type « scoring » qui calculent au sein même du boîtier une note relative au respect de critères prédéfinis par l’assureur (par exemple ne pas rouler entre minuit et 6h du matin). Si ce type de solution est particulièrement optimisé en terme de volume de données, l’assureur n’a par contre aucune information à sa disposition pour faire évoluer son offre. C’est le principal défaut de ce type de solution. Sans oublier que bien souvent, la définition des paramètres rentrant en jeu dans l’algorithme de notation nécessite de disposer initialement d’un volume important de données ; données qui sont généralement recueillies à la suite d’une phase de tests préliminaires réalisée au moyen d’enregistreurs fonctionnant en continu.

 On observe ainsi que, de par la quantité d’informations transmises, ces deux types d’enregistreurs sont donc complètement différents et ne répondent pas au même besoin. C’est donc tout l’enjeu du BIG DATA de définir la quantité et le niveau de détail des données pour répondre aujourd’hui et demain aux besoins des assureurs.

 «Il devient urgent de se poser les bonnes questions et définir son réel besoin sachant que ce besoin, et c’est toute la difficulté, va rapidement évoluer dans le temps tout comme le comportement des automobilistes. »

 

 Les statistiques : un moyen efficace pour modéliser le risque routier

 Prévoir et évaluer des risques au moyen de gros volumes de données n’est pas une tâche des plus faciles. Heureusement que dans ce domaine, de nombreux outils mathématiques comme les statistiques fournissent des solutions efficaces pour dégager des tendances, déceler des écarts ou encore appréhender certains comportements. C’est d’ailleurs par ce mode de représentation que les organismes de prévention routière et les assureurs présentent annuellement leurs chiffres et prennent leurs décisions. Les outils statistiques représentent de surcroît un moyen simple et efficace de réduire le volume de données à stocker si bien que l’on pourrait se demander s’il ne serait pas intéressant d’agréger toutes ces données à l’intérieur des boîtiers avant de les transférer.

 

 

 D’ailleurs, c’est la méthode retenue dans le concept ebonus® et cela pour au moins 3 bonnes raisons :

• La première des raisons vient d’être évoquée : à quantité d’information quasi similaire, le volume des données à transmettre est minimal réduisant de facto le coût de transfert, de stockage et de sécurisation des données.

• La seconde raison concerne le respect de la vie privée. En agrégeant directement les données avant de les transmettre, il ne peut y avoir d’atteinte à la vie privée. C’est en France le constat réalisé par la CNIL qui a ainsi retenu la méthode dans ses recommandations publiées le 8 avril 2010 .

• et pour  troisième raison :  l’agrégation des données à bord des véhicules n’est pas impactée par la taille mémoire limitée des boîtiers télématiques. En agrégeant directement les données à la volée, la mise à jour des statistiques peut être réalisée toutes les secondes et sur une durée de temps infini alors que bien souvent, en enregistrement continu, les données sont prélevées à période définie (toutes les minutes ou tous les km par exemple) et sur une durée limitée (1 mois par exemple).

 


Enfin, si ces statistiques sont conservées sur un plus long terme, elles devraient pouvoir aider les assureurs à étoffer leur contrat de protection juridique en introduisant, dans le cas d’un accident responsable, un accompagnement supplémentaire pour les clients pouvant témoigner d’un antécédent de conduite exemplaire.

 

 

 

Ebonus : du BIG DATA au SMALL DATA ?

 En terme de conduite, évaluer un risque avec précision nécessite bien souvent de corréler plusieurs variables comme la durée de trajet, la vitesse, les accélérations ou encore le type de route. Ce besoin, ebonus® y répond parfaitement en fournissant à l’assureur des distributions statistiques à plusieurs dimensions construites à partir des 9 variables suivantes :

 

- Le jour de circulation
- L’heure de circulation
- Le type de route
- La vitesse
- Les accélérations longitudinales et transversales
- Le freinage
- La durée des trajets
- La distance parcourue
- Les périodes calendaires

 

En terme de souplesse, il est à noter que chacune de ces distributions peut être reconfigurée à distance et à volonté en redéfinissant (liste non exhaustive) :

- Nv: son nombre de variables (1, 2, 3, ...)
- Tv: le type de ses variables (vitesse, type de route, …)
- Iv: les intervalles de valeurs associés à chacune de ses variables (« Autoroute », [0..30km/h], [16h..18h],…)
- Fe: La fréquence d’échantillonnage (1Hz, 10Hz, …)
- Da: La durée totale d’acquisition avant transfert (1jour, 1mois, 1 an, …)

 selon la formule : D={ Nv, [Tv], [Iv], Fe, Da }

 

Ainsi, un assureur qui souhaiterait recueillir des données particulières avant de lancer une offre sur un segment de marché encore inexploité peut très bien commencer en proposant une offre basée sur le kilométrage tout en récupérant une distribution à 3 ou 4 variables par exemple pour valider son projet.

De même, pour une phase de test uniquement, il est tout à fait possible de configurer le module d’agrégation pour transférer les résultats statistiques toutes les 10mn alors que pour une offre commerciale, ce même transfert d’information peut être effectué tous les mois ou tous les trimestres par exemple.

Si l’on s’intéresse maintenant de plus près au volume de données que représente ces informations statistiques, on se rend vite compte que le stockage d’une distribution à 3 dimensions par exemple telle que que la distribution Di définie ci-dessous (voir illustration ci-après) :

 Di={ 3, [Vitesse, Type de route, Heure ], [(0,50,90,110,130 km/h), (« Autoroutes », « Nationales - Départementales » « Agglomérations »),(Jour [7h..21h], Nuit [21h..7h])], 1s, 30j}

 

ne nécessite pas plus de 160 octets soit un SMS et cela quel que soit la durée totale d’acquisition. Ceci sous-entend qu’avec un seul MMS de 50 Ko il est tout à fait possible de récupérer par véhicule pas moins de 300 distributions à 3 dimensions pour un coût quasiment nul, et qu’un seul disque dur de 50 Go s’avère largement suffisant à lui seul pour enregistrer ce même nombre de distributions pour 1 000 000 de véhicules connectés.

Autant dire qu’avec ebonus, on se rapproche plus du LOW DATA que du BIG DATA.

 

Enfin, le stockage de données dans un format brut ou sous forme agrégée peut ne pas être assujetti aux mêmes contraintes règlementaires. En France, par exemple, la CNIL impose pour des données brutes géolocalisées dont l’exploitation peut aller bien au-delà du besoin des assureurs, une durée de conservation limitée au seul temps nécessaire pour effectuer le calcul de la prime (1). Si par cette contrainte, les marges de manœuvre s’avèrent particulièrement réduites, il est légitime de se poser la question de l’intérêt de stocker massivement des données dans un format qui ne pourra peut-être pas être exploité dans le temps.

 

 

Plus d'info :

e-bonus, la technologie Pay-As-You-Drive optimisée pour vos infrastructures de stockage et capable de protéger la vie privée de l'utilisateur . Contactez-nous dès à présent...

 

 
Suivant >