DBMar 29

DaiSy: A Library for Scalable Data Series Similarity Search

Francesca Del Gaudio, Manos Chatzakis, Gayathiri Ravendirane, Botao Peng, Themis Palpanas

arXiv:2603.2771939.1h-index: 57Has Code

Predicted impact top 39% in DB · last 90 daysOriginality Synthesis-oriented

AI Analysis

DaiSy provides a comprehensive, open-source library for exact similarity search, addressing the fragmentation of existing solutions for researchers and practitioners in data series and vector similarity search.

DaiSy is a unified library for exact data series similarity search that integrates multiple state-of-the-art algorithms and supports disk-based, in-memory, GPU-accelerated, and distributed execution environments. It is also applicable to vector data and provides C++ and Python interfaces.

Exact similarity search over large collections of data series is a fundamental operation in modern applications, yet existing solutions are often fragmented, specialized, or tailored to specific execution environments. In this paper, we present DaiSy, a unified library for exact data series similarity search that integrates multiple state-of-the-art algorithms within a single, coherent framework. DaiSy is the first library to support exact similarity search across diverse execution environments, including implementations for disk-based, in-memory, GPU-accelerated, and distributed scalable similarity search. Although designed for data series, DaiSy is also directly applicable to exact similarity search over vector data, enabling its use in a broader range of applications. The library supports interfaces in both C++ and Python, enabling users to easily integrate its functionality into a variety of tasks. DaiSy is open-sourced and available at: https://github.com/MChatzakis/DaiSy.

View on arXiv PDF Code

Similar