Repousser les limites du stockage de données grâce à l'apprentissage automatique
Inscrire et relire des informations avec la plus grande densité de stockage possible est un enjeu permanent pour les données numériques. Dans ce travail, une nouvelle méthode permettant d’aller au-delà des meilleures technologies actuelles a été développée utilisant des nanostructures de silicium et des réseaux de neurones artificiels.
Les données digitales 0 et 1 (bits) des supports de stockage optique tels que les CD et DVD sont encodées par la gravure de successions de creux et de plats sur la surface du disque. Ils sont décodés par le laser de la tête de lecture, le signal étant sensible au passage d'un creux à un plat ou réciproquement. Le faisceau laser sur la surface du disque a une taille qui est de l'ordre de la longueur d’onde de la lumière, ce qui limite la taille minimale du "bit" et donc la capacité de stockage d'un CD ou DVD. La technologie Blu-Ray a permis d'utiliser des longueurs d'onde bleues, plus courtes, et d'augmenter cette capacité. Aller au-delà reste un défi ouvert depuis 20 ans. Dans ce travail, des chercheurs du Centre d’élaboration de matériaux et d’études structurales (CEMES, CNRS) et du Laboratoire d’analyse et d’architecture des systèmes (LAAS-CNRS) à Toulouse ont fabriqué des nanostructures permettant l'encodage de bits de données avec une densité bien plus importante que celle de la technologie Blu-Ray et ils ont montré que le décodage pouvait se faire quasiment sans aucune erreur par lecture optique grâce à l'utilisation d'un outil d'apprentissage automatique, les réseaux de neurones artificiels.
Les nanostructures ont été réalisées dans la centrale Renatech du LAAS-CNRS par gravure du silicium après lithographie par faisceau d'électrons. Différentes séquences de creux et de plats ont été gravées au sein de plots nanométriques, encodant jusqu‘à 9 bits d’information par nanostructure. Chaque structure diffuse la lumière de façon spécifique et possède ainsi une signature optique unique aux longueurs d'onde de la lumière visible. Néanmoins, une lecture fiable de cette signature par une analyse optique traditionnelle est très difficile en raison de la sensibilité du signal aux petites variations de fabrication et au bruit de la détection. Pour pallier ce problème, les chercheurs ont utilisé une méthode d'analyse totalement différente, qui mime de façon simplifiée le fonctionnement des neurones du cerveau. Grâce à un apprentissage sur un grand nombre de fabrications des mêmes séquences, ils ont formé un réseau de neurones artificiels à identifier les nanostructures par la lumière diffusée (Figure). Ils ont démontré que, malgré le bruit important contenu dans le signal lumineux, le réseau était capable de reconnaître quasiment sans aucune erreur des séquences contenant jusqu’à 9 bits. Ils ont de plus montré que l'analyse était possible en utilisant, non pas toutes les longueurs d'onde, mais seulement trois couleurs de base (bleu, vert et rouge). Leurs résultats montrent que la fiabilité et la rapidité de cette méthode pourront être comparables à celles de la lecture Blu-ray.
S'appuyant sur des méthodes très largement répandues telles que les technologies à base de silicium, la détection de la lumière diffusée, et l'apprentissage automatique par des réseaux de neurones artificiels, ce travail démontre une nouvelle méthode d’encodage à base de nanostructures diélectriques et de décodage optique de l'information numérique, autorisant une meilleure efficacité de stockage que les supports optiques actuels. Sous réserve de la faisabilité à grande échelle de l'encodage par nano-fabrication, elle pourrait être envisagée par exemple dans le cas d'archivage de données.
Référence
Pushing the limits of optical information storage using deep learning.
Peter R. Wiecha, A. Lecestre, N. Mallet et G. Larrieu, Nature Nanotechnology, le 21 janvier 2019.
Lire l’article sur la base d’archives ouvertes ArXiv.