Redécouvrir Redis dans la recherche de similarité (Vector Similarity Search)

26/09/2023 | 10h15 - 11h00 | Salle de Conférence 3

Description

Depuis l'avènement de ChatGPT, la recherche par Vector Similarity Search a pris de l'importance. À la base, VSS permet aux développeurs de faire des requêtes et de récupérer des informations sur des données non structurées (ex., audio, langage naturel, images, vidéo...).
Grâce aux progrès du Deep Learning, les data scientists peuvent construire des modèles capables de transformer presque n'importe quelle "entité" de données en sa représentation vectorielle. Une entité peut être une transaction, un profil d'utilisateur, une image, un son, un long morceau de texte (phrase ou paragraphe), une série chronologique ou un graphique. Chacun de ces éléments peut être transformé en "vecteur de caractéristiques", également connu sous le nom de "Embeddings". Ces vecteurs capturent les caractéristiques les plus essentielles d'une entité de manière à ce que les machines et les bases de données puissent facilement les comparer. Ce qui est intéressant ici, c'est que si un modèle génère deux embeddings (vecteurs) similaires pour deux entités, on peut en déduire que les deux entités d'origine sont similaires d'une manière fondamentale.



En tant que base de données polyvalente, Redis stocke, indexe et interroge les données vectorielles. Il permet aux développeurs de stocker les vecteurs aussi facilement que de simples Hashes ou documents JSON. Ensuite, grâce au module RediSearch, il fournit des capacités d'indexation et de recherche avancées nécessaires pour effectuer des requêtes à faible latence dans de grands espaces vectoriels, allant typiquement de dizaines de milliers à des centaines de millions de vecteurs distribués sur plusieurs machines.

Speaker: Amine El Kouhen, Solution Architect, Redis

Exposant


PLUS DE CONTENUS EXCLUSIFS BIG DATA & AI