QlikSense хорошо справляется с подготовкой данных при помощи встроенного ETL – Extract, Transform, Load – алгоритма по очистке и преобразованию данных. Более того, с его помощью можно объединять данные из разных источников. Плюс самостоятельно написанные коннекторы (например, для 1С).
Есть много тонкостей работы с ETL, которые зависят от вашего желания и умения погружаться в данный пласт работы.
+ Оптимальная детализация Здесь актуальны вопросы о способе хранения информации, например, нужно ли хранить данные в формате YYYY-MM-DD hh-mm-ss (дата со временем), если в приложении речь идет только о днях (дате без времени). Или же хранить числа с точностью до 10 знака после запятой, когда основная единица измерения в отчете миллионы.
+ Оптимальная нагрузка Несмотря на потенциальную возможность, стоит избегать глобальной модификации данных внутри самого QlikSense. Например, вы забираете данные с SQL-сервера и затем агрегируете их. Разумно будет провести эту операцию непосредственно на стороне БД. Конечно, если признак агрегации есть непосредственно в БД, но если его нет, то можно воспользоваться возможностью сделать это уже силами QlikSense.
Предварительная сортировка текстовых данных – весьма полезная вещь для больших объемов информации. Работа с текстом всегда медленнее, нежели с числами. Иногда сделать сортировку в скрипте и в визуальной части использовать сортировку в порядке загрузки данных выгоднее. Или же добавить поле с числовой сортировкой. И крайне рекомендуется прочитать про функцию
DUAL.
+ Лишние поляРазумеется, что лишние поля можно и нужно удалять из готового продукта (функции
drop fields, drop table)
Переменную удалить можно только вручную из редактора переменных независимо от того, где ее создали – поэтому старайтесь не захламлять ваш список переменных.